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Előszó 


Az információelmélet a hírközlés matematikai elmélete. Születését lényegében 
Claude Shannon [43] művének 1948-as megjelenéséhez köthetjük. Ez a munka 
volt az első, amely matematikai alapossággal tárgyalta az adattömörítés, a bizton- 
ságos adatátvitel és a titkosítás problémáit. Shannon adott először kezelhető és 
hasznos matematikai modelleket az információs folyamatok leírására, mégpedig 
úgy, hogy az egyes problémák esetén tisztázta az elvi határokat, és többségében 
meg is konstruálta azokat a módszereket, amelyek ezeket az elvi határokat aszimp- 
totikusan elérik. Ugyanakkor napjainkban tömegesen terjedtek el az egyes adat- 
tömörítő és hibakorlátozó eljárások, tehát indokolt, hogy ezek alapvető elveit is 
áttekintsük. Az 1. fejezetben ismertetjük a veszteségmentes adattömörítést, míg 
a 2. fejezetben a veszteséget (torzítást) megengedő adattömörítő (forráskódoló) 
eljárásokat tárgyaljuk. A 3. fejezet témája a csatornakódolás. 

A forráskódolás elméletével ellentétben a csatornakódolás eredményei nem 
konstruktívak, tehát ma még nem ismertek olyan kódolási—dekódolási eljárások, 
amelyek tetszőleges csatorna esetén a csatornakapacitást megközelítenék. Ugyan- 
akkor ismertek olyan algebrai hibavédő kódok, amelyek számos gyakorlati prob- 
léma megoldását segítik. A "80-as évektől alkalmazzák polgári célokra is a hiba- 
védő kódokat, napjainkban a CD-ben használt Reed-Solomon-kód szinte minden 
háztartásban megtalálható. A 4. fejezet összefoglalja a hibajavító kódok alapjait. 

Az 5. fejezet témája a nyilvános kulcsú titkosítás, tehát az a probléma, hogy 
nyilvános hálózaton hogyan biztosítható az adat- illetve hozzáférésvédelem. 

Ez a tankönyv a Linder — Lugosi [25] és a Györfi — Vajda [22] jegyzet , unió- 
jának" a kiegészítése azon tapasztalatok felhasználásával, amelyeket a BME mű- 
szaki informatikusoknak tartott Információelmélet és Kódelmélet tárgyak oktatása 
során szereztünk az elmúlt 10 évben. 
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A mű elkészítésében nyújtott segítségükért szeretnénk köszönetet mondani 
György Andrásnak, Laczay Bálintnak, Linder Tamásnak, Lois Lászlónak, Lugosi 
Gábornak, Pataricza Andrásnak és Pintér Mártának. 
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Győri Sándor 
Vajda István 


1. fejezet 


Változó szóhosszúságú 
forráskódolás 


Ebben a fejezetben bevezetjük a veszteségmentes adattömörítés fogalmát. En- 
nek célja az, hogy egy üzenetet, amely egy véges halmaz (forrásábécé) elemeiből 
álló véges sorozat, egy másik véges halmaz (kódábécé) elemeiből álló sorozattal 
reprezentáljunk úgy, hogy ez a reprezentálás a lehető legrövidebb (és belőle az 
üzenet visszaállítható) legyen. Ennek megfelelően azt vizsgáljuk, hogy az adat- 
tömörítésnek melyek az elvi határai, és ezeket a határokat hogyan közelíthetjük 
meg. A legismertebb példa erre az, amikor a kódábécé a (0, 1) halmaz, és egy 
üzenetet (pl. írott szöveg, fájl) bináris sorozatok formájában kódolunk tárolás, il- 
letve átvitel céljából. Az üzenetet kibocsátó objektum — az információforrás — 
modellezésével és vizsgálatával az 1.6. szakasz foglalkozik (mivel valószínűségi 
modelleket használunk, ezért az üzenetek betűi valószínűségi változók lesznek). 
Célunk az, hogy az ehhez szükséges matematikai apparátust bevezessük. Megis- 
merkedünk az üzenetek egy természetesen adódó kritérium szerinti kódolásával 
— az egyértelműen dekódolható kódolással —, mely később vizsgálataink kö- 
zéppontjában áll majd. Bevezetjük a diszkrét valószínűségi változó entrópiáját, 
és megmutatjuk, hogy az entrópia milyen alapvető szerepet játszik a kódolással 
kapcsolatban. Az elkövetkezőkben mindig azt tartjuk szem előtt, hogy az üzene- 
tek kódja minél rövidebb legyen, ezért a kódok általunk vizsgált fő tulajdonsága 
a átlagos kódszóhossz lesz. A fejezetet az univerzális forráskódolással és annak 
gyakorlati alkalmazásaival zárjuk. 

A hírközlési rendszerek működését egzakt matematikai eszközökkel fogjuk 
vizsgálni. Persze sokféle matematikai modellt állíthatunk hírközlési feladatokra, 
de kezdetben az egyik legegyszerűbbet választva jól kifejezhetjük a probléma lé- 
nyegét. A hírközlés alapfeladata az, hogy valamely jelsorozatot (, információt") 
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1.1. ábra. Hírközlési rendszer blokkdiagramja. 
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1.2. ábra. A kódoló és a dekódoló felépítése. 


el kell juttatni egyik helyről a másikra. A távolságot (vagy időt) áthidaló hír- 
közlési eszköz — a csatorna — azonban csak meghatározott típusú jeleket képes 
átvinni. Az információforrás által produkált jelfolyamot kódolással meg kell fe- 
leltetni egy, a csatorna által használt jelekből álló jelfolyamnak. A felhasználó 
(nyelő) a csatorna kimenetén pontosan, vagy megközelítőleg visszaállítja, dekó- 
dolja az üzenetet. Egy ilyen rendszer blokkdiagrammja látható az 1.1. ábrán. 

A kódoló általános esetben három részből áll. Az első a forráskódoló, amely 
a forrás üzeneteit gazdaságosan, tömören reprezentálja. Ezzel foglalkozik az első 
két fejezet. A második rész a titkosító (5. fejezet), és ahharmadik a csatornakódoló 
(3. és 4. fejezet). Ennek megfelelően a dekódoló is három részből áll: csatornade- 
kódoló, visszafejtő és forrásdekódoló (1.2. ábra). 


1.1. Egyértelmű dekódolhatóság, prefix kódok 


Jelöljön X egy diszkrét valószínűségi változót, amely az X — (x1, x2 , . . . , Xn) véges 
halmazból veszi értékeit. Az X halmazt a továbbiakban forrásábécének, elemeit 
pedig betűknek nevezzük. 

Yy jelöljön egy s elemű (y1i,y2, . . . , s ) halmazt. Ezt kódábécének nevezzük. 
y" jelölje az y elemeiből álló véges sorozatok halmazát. 4" elemeit kódsza- 
vaknak nevezzük. Egy f : X — 9" függvényt, amely megfeleltetést létesít a for- 
rásábécé és a kódszavak között, kódnak nevezünk. Az X elemeiből alkotott véges 
sorozatok az üzenetek vagy közlemények (értékeiket az X" halmazból veszik). 
Amennyiben az f kód értékkészlete különböző hosszú kódszavakból áll, úgy vál- 
tozó szóhosszúságú kódolásról beszélünk. 


1.1. EGYÉRTELMŰ DEKÓDOLHATÓSÁG, PREFIX KÓDOK 11 


1.1. definíció. Az f : X — Y" kód egyértelműen dekódolható, ha minden vé- 
ges kódbetűsorozat legfeljebb egy közlemény kódolásával állhat elő, azaz ha u € 
X7, v E XT, u — u1u2 . . . uk, V. — VIV2 . . Vm, u / V, akkor f(ui)f(u2) . .. f(uk) A 
f(vD)f(v2) ...f(wm). (itt az f(u)f(u) a két kódszó egymás után írását [konkate- 
náció] jelenti.) 
MEGJEGYZÉS: 


a) Az egyértelmű dekódolhatóság több, mint az invertálhatóság. Ugyanis le- 
gyen X — fa ,b,cy,4 — (0,1) és f(a) — 0,f(b) — 1, f(c) — 01. Ekkor 
az f : X — 9" leképezés invertálható, viszont a 01 kódszót dekódolhatjuk 
f(a)f(b) — 01 szerint ab-nek, vagy f(c) — 01 szerint c-nek is. 


b 


Me 


Az előbbi definícióban szereplő kódolási eljárást, amikor egy közlemény 
kódját az egyes forrásbetűkhöz rendelt kódszavak sorrendben egymás után 
írásával kapjuk, betűnkénti kódolásnak nevezzük. Természetesen a kódo- 
lást teljesen általánosan egy g : X" — 4" függvénnyel is definiálhatnánk, 
de később látni fogjuk, hogy a betűnkénti kódolás és annak természetes 
kiterjesztése, a blokk-kódolás elegendő számunkra. 


1.2. definíció. Az f kód prefix, ha a lehetséges kódszavak közül egyik sem foly- 
tatása a másiknak, vagyis bármely kódszó végéből bármekkora szegmenst levágva 
nem kapunk egy másik kódszót. Egy prefix kód egyben egyértelműen dekódol- 
ható is. 

Az eddig bevezetett fogalmak illusztrálására nézzük a következő példákat: 
1.1. példa. X— fa,b,cy; 4— 10,1) A kód legyen a következő: f(a) — 0, f(b) — 
10, f(c) — 110. Könnyen ellenőrizhető, hogy a kód prefix. 

Ha az abccab üzenetet kódoljuk, akkor a 010110110010 kódbetűsorozatot 
kapjuk. A kódból az üzenet visszafejtése nagyon egyszerű a prefix tulajdonság 


miatt; többek között ez a gyors dekódolási lehetőség teszi vonzóvá a prefix kódo- 
kat. 


1.2. példa. X — f(a,b,c,dt y—(0,1); f(a)— 0, f(b) —01, f(c) —OLL, f(d) — 
0111. Jól látható, hogy a kód nem prefix, de egyértelműen dekódolható, hiszen a 
0 karakter egy új kódszó kezdetét jelzi. 


1.1. lemma (McMillan). Minden egyértelműen dekódolható f : X — y" kódra 
n 
ys6 £I, (1.1) 
i—I1 


ahol s a kódábécé elemszáma, és If(x:;)l jelöli az f(x;) kódszóhosszát. 
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BIZONYÍTÁS: Tekintsük az (1.1) összeg N-edik hatványát: 


i171 iN 


N 
(iven) — PF Yo szen feny 99 Aus, 
151 1 


ahol Lmax — max If(x:) Il; és A; jelöli az összes / hosszúságú, N darab kódszó egy- 
1£n 


más után írásával keletkező kódbetűsorozatok számát. Mivel feltevésünk szerint 
f egyértelműen dekódolható, az összes ilyen / hosszú sorozat különböző, tehát 


Aj 2 si. 


Ebből azt kapjuk, hogy 


ő N 
Pp na) EIN : Lmax; 
i—1 


vagyis 


Xs OI c VN Vmax. (1.2) 
i—1 


Mivel N tetszőleges, és tudjuk, hogy VN 1, VLmax 7 1, haN — cos, ezért (1.2) 
csak úgy állhat fenn minden N-re, ha (1.1) igaz. B 


2 


A következő lemma bizonyos értelemben az előző megfordítása. 


1.2. lemma (Kraft). Ha az [1 , 2 , . . . , In pozitív egész számokra 
n 
Es" el, (1.3) 
i—1 
akkor létezik olyan f prefix kód, hogy 


fGl— Lk, i—]1,...,n. 


BIZONYÍTÁS: Az egyszerűség kedvéért tegyük fel, hogy az I; számok nagyság 

szerint növekvő sorrendben vannak: /j £ 1] 2 :-:-:- a In. A bizonyítás technikája 

megkívánja, hogy a kódábécé (y1,y2, . . . , s ) elemeit a (0, I, . . . ,§ — 1 ) számokkal 

helyettesítsük (például a következő megfeleltetés szerint: yym.i— 1, i— l,.. . , 5). 
Definiáljuk a w ; számokat a következőképpen: 


j—1 
FADAZSS 23 . 
wi —0, wj— Es" úz Jee dsssaázító 
i—1 


1.2. ÁTLAGOS KÓDSZÓHOSSZ, ENTRÓPIA 13 


(1.3) mindkét oldalát s41-nel szorozva, majd mindkét oldalból 1-et levonva kapjuk, 
hogy 


n—-1 
Wn — 978 sin li L sn—1. 
i—1 


Hasonlóképp eljárva azt kapjuk minden j-re, hogy wj £ si — 1. Ezek után defi- 
niáljuk f(xj)-t mint a wj szám s alapú számrendszerben felírt alakját, amelynek 
elejére annyi 0-t írunk, hogy a hossza 7; legyen. A kódszavak nyilván különbözők 
lesznek mivel wj C wx, ha j € k. Most belátjuk, hogy az így kapott kód prefix. 


Tegyük fel ugyanis ennek az ellenkezőjét, vagyis azt, hogy valamilyen j — k ese- 
tén f(xj) végéhez I, — I; darab számjegyet hozzáadva megkapjuk f(xx)-t. Ekkor 








wj — TET) következne. (Az Ix] jelölés az x valós szám alsó egész részét jelöli). 
Viszont 
vág E Tl ss 
ES TÉ ae. 2 e lálzal az 2 ját a 5 
i—1 i—j 
és így ellentmondásra jutottunk. ha 


1.1. következmény. Az 1.1. és 1.2. lemmákat összevetve levonhatjuk azt a fon- 
tos következtetést, hogy minden egyértelműen dekódolható kódhoz létezik vele 
ekvivalens (azonos kódszóhosszú) prefix kód, tehát nem vesztünk semmit, ha az 
egyértelmű dekódolhatóság helyett a speciálisabb, és ezért könnyebben kezelhető 
prefix tulajdonságot követeljük meg. 


1.2. Átlagos kódszóhossz, entrópia 


Legyen X egy X értékű valószínűségi változó, amit kódolni akarunk. Vezessük be 
a következő p : X — [0, 1] függvényt: 


p(x) — P(x —x], xeX. 


A p(x) függvény tehát az x forrásbetűhöz annak valószínűségét rendeli. 


644 


PT 


H(X) — E(- logp(xX)) —— 2, p(xi) log p(xi). 


i—1 


összeggel definiáljuk. 
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MEGJEGYZÉS: 


a) A logz jelölés a z pozitív szám kettes alapú logaritmusát jelenti. Mivel 
az 1.3. definíció megkívánja, a logaritmusfüggvénnyel kapcsolatban a kö- 
vetkező , számolási szabályokat" vezetjük be (a 2 0,b 5 09: 


0 a b 0 
0109— — 01og— — 0; blog — — 7-oo; blog — — —oo 
0987 989 987 - 087 


(E szabályok az adott pontban nem értelmezett függvények folytonos kiter- 
jesztései.) A definícióból közvetlenül látszik, hogy az entrópia nemnegatív. 
Vegyük észre, hogy az entrópia értéke valójában nem függ az X valószínű- 
ségi változó értékeitől, csak az eloszlásától. 


b) Az entrópia intuitív fogalmával kapcsolatban lásd az 1.6. tétel utáni meg- 
jegyzést. 


1.4. definíció. Egy f kód átlagos kódszóhosszán az 


D7- 


EIf(X)I— X.PGDIFGDI 


i-1 


várható értéket értjük. 


1.3. példa. Az 1.1. példa kódja esetén legyen p(a) — 0.5, p(b) — 0.3, p(c) — 0.2, 
ekkor az entrópia 


H(X) — —0.5 :10g0.5 — 0.3 -1og0.3 —0.2 -1og0.2 A 1.485, 
az átlagos kódszóhossz pedig 
Elf(X)I—0.5:-1--0.3-2-0.2-3— I.7. 


Ahhoz, hogy az egyértelműen dekódolható kódok átlagos kódszóhossza és 
entrópiája közti alapvető összefüggést bebizonyítsuk (ami tulajdonképpen e feje- 


zzz 


zet fő állítása), szükségünk van két segédtételre: 


1.1. tétel (Jensen-egyenlőtlenség). Legyen h egy valós, konvex függvény az la, b] 
zárt intervallumon, azaz minden x,y € la,bl és0 c A c 1 esetén 


h(Ax-k(1—AJy) 2 Ah() 4 (1—AJh(y), (1.4) 


és legyen Z egy valószínűségi változó, amely értékeit az la, b] intervallumban ve- 
szi fel. Ekkor 
hIE(Z)] £ EI(Z)] (1.5) 
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Továbbá, ha h az E(Z) pontban szigorúan konvex, vagyis az (1.4)-ben Ax -- 
(1—2)y — E(2) esetén határozott egyenlőtlenség teljesül vx,y-ra, akkor (1.5)- 
ben egyenlőség akkor és csak akkor áll fenn, ha 


PíZ —E(Z2)j— 1, 
vagyis haZ 1-valószínűséggel konstans. 


BIZONYÍTÁS: Mivel h konvex, ezért az (a,b) nyílt intervallum minden pontjá- 
ban létezik a jobb és a bal oldali deriváltja és a bal oldali derivált legfeljebb akkora 
mint a jobb oldali. Továbbá az is igaz, hogy ezekkel a deriváltakkal mint mere- 
dekségekkel húzott félérintők a függvénygörbe alatt fekszenek la, b]-ben. Jelölje 
c a jobb oldali deriváltat az E(Z) pontban, és írjuk fel itt a jobb oldali félérintő 
egyenletét: 

g(x) — chr—E(2)] 4 hIE(2)I. 


Ekkor az előbbiek szerint h(x) 2 g(x) bármely x ec [a,b] pontra, vagyis 


h(x) 


! A 


che— E(2))] —- hE(Z)]. (1.6) 


Tehát írhatjuk hogy 
n(Z) 2 clZ— E(2)] 74-h[E(2)], 


2 z 


ahol mindkét oldal várható értékét véve megkapjuk az első állítást. Mivel szi- 
gorúan konvex esetben (1.6)-ban egyenlőség csak x — E(Z) esetben teljesül, a 
második állítás triviálisan adódik. ha 


1.2. következmény. 


a) Ha p; 2 0, a; - 0, i — 1, 2,...,n valós számokra 


akkor Ni A 
— ) pilogpi £c— ) pilogg; 1.7) 


i—1 i-1 


és egyenlőség akkor és csak akkor áll fenn, ha p; — ag; minden i-re. 


b) Haa; 20, b; 50, i — 1,2,...,n valós számokra 


És és Ybi-b, 
i—1 i 
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akkor 
4 b; b 
DF a:log— £ a:10g—, 
i—1 di a 


és egyenlőség pontosan akkor áll fenn, ha 2 — konstans minden i-re. 
1 


BIZONYÍTÁS: 


a) (1.7) ekvivalens azzal, hogy 


b) 


n 3 
— ) p:log 2, 
i—1 Pi 


Mivel a h(x) — —logx függvény szigorúan konvex az értelmezési tartomá- 
nyán (a második deriváltja pozitív), így felhasználhatjuk a Jensen-egyenlőt- 
lenséget a következőképpen: 


Legyen Y egy olyan valószínűségi változó, hogy 


pír 2 - Pi; — 1—1,...n. 
Di 


Ekkor a Jensen-egyenlőtlenség szerint 
n gi 
— FF pilog— — E(—logy) 2 —logE(Y )- ogy pit — 
i—1I Di 


és egyenlőség akkor és csak akkor teljesül, ha £ — konstans minden i-re, 
de ekkor az összegekre vonatkozó feltételek miatt p; — g; minden i-re. 


Ha a — 0, akkor va; — 0, s ekkor az állítás , számolási szabályaink" felhasz- 
nálásával minden b - 0-ra teljesül. Ha a - 0, akkor az a) pont szerint 


t ga b 
(s log — TP aitog] 7 - HE sz zés b 
tehát a zárójelben levő kifejezésre 
bi; / b 
a;199—— ) ajlog— 20. 
)3 ilog 2 ilog7 S 
Szintén az a) pont szerint az egyenlőség feltétele az 7 — Ti, v vagyis az B; sz 


; — konstans minden i-re. 
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Most kimondjuk a fejezet egyik főtételét. 


1.2. tétel. Tetszőleges egyértelműen dekódolható f : X — 47" kódra 


ELJ(X -2p( xi) fel 2 ő] 





; (1.8) 
logs 


MEGJEGYZÉS: Ha az entrópia definíciójában kettes alapú logaritmus helyett 5- 
alapú logaritmust használnánk, akkor ezt az entrópiát H,(X )-szel jelölve tes JE 
H,(X ) miatt (1.8) a következő alakú lenne: 





ELfC0I2 H(X). 


BIZONYÍTÁS: Az (1.8) állítás ekvivalens a következővel: 


PC) logs7I60 té 


Mm 


H(X) £ — 


i—1 


A Jensen-egyenlőtlenség 1.2. a) következményét alkalmazva a 


576) 
Di — P(x), di — ———— , i—],...,n; 
488 57166)! 
jEi 


szereposztásban megkapjuk az állítást: 


13: 


H(X) — p(x;) log p(xi) 2 


II 
feet 


S —I f(x) 
Dp(xi) 1099 ——  — 
s-t) 


j—I1 


P(x) logs" 6: ] 4 log 83 tat) z 


i—1 


IA 
l 
TD 


II 
p.a 


I 
! 
Mm 


II 
fit 





! 
TM: 


II 
FabS 


s 


ahol az utolsó egyenlőtlenségnél az 1.1. lemmát, a McMillan-egyenlőtlenséget 
használtuk fel. HI 


Miután láttuk, hogy egy X valószínűségi változó egyértelműen dekódolható 





eri mennyiség alsó korlátot ad, most meg- 
mutatjuk, hogy prefix kóddal ezt a korlátot jól meg lehet közelíteni. 
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1.3. tétel. Létezik olyan f : X — 4" prefix kód, amelyre 


ElJf(X)I c E szd 
logs 
1. BIZONYÍTÁS: (Shannon-Fano-kód) Feltehetjük, hogy p(x1) 2 plx2) 22 
Pp(xn-1) 2 p(xn) 5 0, mert különben az X elemeinek átindexelésével elérhetjük 
ezt. A bizonyítás technikája miatt ismét felhasználjuk az yy Rm. i—1, i— 1,...,s 
megfeleltetést. Legyenek a w; számok a következők: 


i—1 
wi —0, w— E p(x), 1—2,...N. 
1-1 


Kezdjük a w; számokat felírni s-alapú számrendszerbeli tört alakban. A w;j-hez 
tartozó törtet olyan pontosságig írjuk le, ahol az először különbözik az összes 
többi w;, i —- j szám hasonló alakbeli felírásától. Miután ily módon n darab véges 
hosszú törtet kapunk, az f(xj) legyen a wj-hez tartozó tört az egészeket repre- 
zentáló nulla nélkül. Könnyedén belátható, hogy az így kapott kód prefix. A 
konstrukció miatt x-hez létezik olyan xx, hogy wj és wx végtelen tört alakjában 
az első I f(xj)1— 1 számjegy azonos. Nyilvánvaló, hogy vagy wj41 vagy wj-1 tört 
alakja ilyen lesz, mivel ezek a w j-hez legközelebbi számok. Az első esetben 





P(x) —wjyi —wy c s VE, (1.9) 

a második esetben 
P(xj-1) —wj—wj-i a sz EDE 

de ekkor p(xj) £ p(xj-1) miatt (1.9) megint következik. Tehát mindkét esetben 

—logpílxj) 2 (If6)I— Dlogs, 
amiből mindkét oldalt p(x;)-vel szorozva és minden j-re összegezve 

n n 
7 £.pe)logpíxj) 2 (E poor 6 1) logs 

következik, így a tételt bebizonyítottuk. B 


2. BIZONYÍTÁS: Legyenek az Il; pozitív egész számok olyanok, hogy 


—log, p(x;) £ I; c —log, p(x;) —- 1, tels (1.10) 
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ahol log, az s-alapú logaritmust jelöli. Az I; számokat nyilván egyértelműen meg 
lehet így választani. A bal oldali egyenlőtlenségből következik, hogy 


n 


n n 
Es" E2 log, p(xi) —Y pw) —1 
i—1 i—1 i—1 
tehát az I; számok kielégítik az 1.2. lemma feltételét, és így létezik f prefix kód [; 
hosszú kódszavakkal (If(x:)l — I). Ha a jobb oldali egyenlőtlenséget (1.10)-ben 
P(x;)-vel megszorozzuk és minden i-re összegezzük, akkor azt kapjuk, hogy 
H(X) 


n n 
P0ES ST PDTeS GML PGVE reg tt Be 


Mm 


[4 


Az 1.1. definíció utáni megjegyzés b) pontjában említettük, hogy a betűnkénti 
kódolásnak van egy természetes általánosítása, a blokk-kódolás. Ezt formálisan 
egy f : X" o y? leképezéssel definiálhatjuk, ahol tehát a forrásábécé betűiből al- 
kotott rendezett m-eseket tekintjük forrásszimbólumoknak és ezeknek feleltetünk 
meg kódszavakat. A helyzet tulajdonképpen nem változik a betűnkénti kódolás 
esetéhez képest, hiszen egy új X forrásábécét definiálhatunk az X — X" jelöléssel, 
és az eddig elmondottak mind érvényben maradnak. Az egyértelmű dekódolha- 
tóság definíciója ugyanaz marad, mint a betűnkénti kódolás esetében, az előbbie- 
ket szem előtt tartva. Legyen X — (XI), . . . , Xm) egy valószínűségi vektorváltozó, 
melynek koordinátái az X-ből veszik értékeiket. Az entrópia 1.3. definíciójából jól 
látszik, hogy az csakis az eloszlástól függ. Mivel X is csak véges sok különböző 
értéket vehet fel, az 1.3. definíciót közvetlenül alkalmazhatjuk. Az X entrópiája 
tehát a 


P(x) — p(xi, . . .,Xm) — PAX — xi, ... Xn — Xxmb, XI... ,Xm EX, 
jelölést bevezetve a következő: 


H(X) — — Y pCdlogpa 


xeXx" 


sz ) E 03 Pp (XI, . , Xm )logp(x1, . . ..Xm). 


xiEX  XxmnEX 


Az X — (X1,...,Xm) entrópiájára a H(X) jelölés mellett, ahol ez a célszerűbb, 
gyakran a H(XI , . . . , Xm) jelölést fogjuk használni. Ha az XI,X), ..., Xm való- 
színűségi változók függetlenek, akkor H(X) a koordináta valószínűségi változók 
entrópiáinak összege: 


— — §Y p(x)logp(x 


xeXx" 
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Szá ASZ ) E 03 Pi (xi) "Pm (xm) log pi(x1) "" : Pm(xm) sz 


xiEX  XxmnEX 
— — ( DX pilDlogpílen) 4 E puli) tosputs) - 
xi EX XxnEX 


H(X;), 1.11) 


I 
Ms 


i—1 


ahol pi(x) — P(X;—x), i—1,...,m 
Ha az XI, . . . , Xm valószínűségi változók nemcsak függetlenek, hanem azonos 
eloszlásúak is, akkor (1.11)-ből 


H(X , . . ..Xm) — mH(X) (1.12) 


következik. 

A betűnkénti átlagos kódszóhossz definíciója értelemszerűen módosul a blokk- 
kódolás esetében: a kódszóhossz várható értékét el kell osztani az egy blokkot 
alkotó forrásbetűk számával, vagyis a betűnkénti átlagos kódszóhosszon a követ- 
kező mennyiséget értjük: 


FEL SZÉ 5 E pe) 


M exm 


Értelemszerűen az 1.2. tétel állítása blokk-kódolás esetén is igaz: 


H(X) 
E 
FOI 2 ege 
hiszen a tétel bizonyítása közvetlenül itt is alkalmazható. 

Az 1.3. tétel következményeként megmutatjuk, hogy blokk-kódolás segítsé- 
gével a betűnkénti átlagos kódszóhossz alsó korlátja tetszőlegesen közelíthető. 


1.3. következmény. Ha XI , . . . , Xm független, X -szel azonos eloszlású valószínű- 
ségi változók, akkor létezik olyan f : X" o y" prefix kód, hogy 


H(X) 1 


logs  m 





1 

—ElIf(X)I c 
mél) ; 
tehát a betűnkénti átlagos kódszóhossz az m blokkhossz növelésével tetszőlegesen 


közelíti a s alsó korlátot. 
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BIZONYÍTÁS: Az 1.3. tételt felhasználva létezik olyan f : X" o 4" prefix kód, 
hogy 





H(X 
E PGY c TÓ 
xeXT 985 
Ebből (1.12) miatt következik 
mH(X) 
E peJly9ic5 : 
XxeX" 085 
ahol mindkét oldalt m-mel osztva megkapjuk az állítást. HI 


1.3. Optimális kódok, bináris Huffman-kód 


Az 1.2. tétel alsó korlátot ad az egyértelműen dekódolható kódok átlagos kód- 
szóhosszára, az 1.3. tétel pedig mutat egy olyan kódkonstrukciót, ahol ezt a kor- 
látot jól megközelíthetjük. A jó kód konstrukciójának problémáját persze ennél 
általánosabban is felvethetjük: konstruáljuk meg az optimális, azaz legkisebb át- 
lagos kódszóhosszú kódot, ha adott az X valószínűségi változó eloszlása. Először 
is gondoljuk át, hogy optimális kód valóban létezik. Ugyan véges kódábécé ese- 
tén is az egyértelműen dekódolható vagy prefix kódok halmaza végtelen, de a 
bizonyos átlagos kódszóhossznál (pl. az - 1) jobb kódok halmaza véges. Má- 
sodszor, vegyük észre, hogy az optimális kód nem feltétlenül egyértelmű; egyenlő 
valószínűségekhez tartozó kódszavakat felcserélhetünk, csakúgy, mint az egyenlő 
hosszú kódszavakat, anélkül, hogy az átlagos kódszóhosszat ezzel megváltoztat- 
nánk. 

Egy optimális kód konstruálását az 1.1. következmény értelmében egy opti- 
mális prefix kód konstruálására lehet visszavezetni. Ezért a következőkben ki- 
mondjuk az optimális prefix kódok néhány tulajdonságát. A továbbiakban az 
egyszerűség kedvéért a bináris, s — 2 esettel foglalkozunk; feltesszük, hogy 4 — 
(0,1). Az általános, s - 2 eset bonyolultabb, és a dolog lényege így is jól látható. 





1.4. tétel. Ha az f : X — (0,1)" prefix kód optimális, és X elemei úgy vannak 
indexelve, hogy p(x1) 2 p(x2) 3 :"" 2 p(xn-1) 2 p(xn) 5 0, akkor feltehető, hogy 
f-re a következő három tulajdonság teljesül: 


a) [fen EIFe2I S: SIf(xn-1)I £ If(xn)l. vagyis nagyobb valószínűsé- 
gekhez kisebb kódszóhosszak tartoznak. 


b) If(xn-)l— If(xn)l. vagyis a két legkisebb valószínűségű forrásbetűhöz tar- 
tozó kódszó egyenlő hosszú. 
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c) Az f(xn-1) és az f(xn) kódszavak csak az utolsó bitben különböznek. 


BIZONYÍTÁS: 


a) Tegyük fel, hogy p(xx) 2 p(xj) és 


b 


c 


es 


Azt 





fel: IfGol. Ekkor x; és xx kódját 
felcserélve egy új f" kódot vezethetünk be, amelyre 


$ POLG — E Pr Lr (xl — 


PEDIFED PE Fe) — PE IFI — P(x) fe) — 
— p(l(if el — f6)D—PG(If e) — [fej 1) — 
(px) — PG) (fel — fe) 2 0, 


II 
jea 


tehát f nem lehet optimális. 


Az állítás egyszerűen belátható, ha arra gondolunk, hogy [f(xn—1)I — If(xn)l 
esetén az If(xn)] utolsó bitjét levágva az optimálisnál kisebb átlagos kód- 
szóhosszú kódot kapnánk, ami még mindig prefix tulajdonságú. Valóban, 
mivel az eredeti kódszó minden más kódszónál legalább eggyel hosszabb 
volt, a csonkítással kapott új kódszó az eredeti kód prefix tulajdonsága miatt 
nem azonos semelyik másikkal, és ugyanezen okok miatt nem is folytatása 
semmilyen más kódszónak. 


Az előző gondolatmenetből világos, hogy ha létezik olyan f(x;) kódszó, 
hogy f(x) és f(xn) csak az utolsó bitben különböznek, akkor az a) és b) 
miatt [f(x)l— [f(x — If(xn)I. Így ha i 4 1— 1, akkor x; és xn-1 kódját 
felcserélve c) teljesül, és a kód optimális marad. HI 


1.5. tétel. Tegyük most fel, hogy az 1.4. tétel feltételei teljesülnek, és hogy a 
(p(x1), p(x2), . . ., D(xn-1) 4 p(xn) ) valószínűségeloszláshoz ismerünk egy g op- 
timális bináris prefix kódot. (AZ xn-1 és xn forrásbetűket összevonjuk egy Xn-1 
szimbólumba; p(xn—1) — p(xn-1) 4 p(xn) ). Ekkor az eredeti (p(xi), p(x2), - . : , 
P(xn-1), P(xn) ) eloszlás egy optimális f prefix kódját kapjuk, ha a g(Xn.1) kód- 
szót egy nullával, illetve egy egyessel kiegészítjük (a többi kódszót pedig válto- 
zatlanul hagyjuk). 


BIZONYÍTÁS: Ag és az f átlagos kódszóhosszát L9-vel és LF-fel jelölve azt 
kapjuk, hogy 


Lr — Le 3 p(xn-1) -- P(xn): 
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Ha f nem lenne optimális, akkor a nála kisebb L: átlagos kódszóhosszú f? kódról 
az 1.4. tétel c) pontja szerint feltehetnénk, hogy f"(xn—1) és f"(xn) nem rövideb- 
bek semelyik más kódszónál, és csak az utolsó bitben különböznek egymástól. 
Ezt az utolsó bitet elhagyva a fp(x1), p(x2) , . . . , P(xn-1) 4 p(xa) ) eloszlásra egy 
27 kódot kapnánk, amire 


Le -— Lp — p(xn—1) — p(xn) 2 Lf — p(xn-1) Sza P(xn) esz Le 
teljesülne, tehát az optimális g-nél jobb kódot kapnánk, ami lehetetlen. HI 
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Az előző tétel alapján már megadhatjuk az optimális prefix kód Huffman-féle 
konstrukcióját: A két legkisebb valószínűség összevonásával addig redukáljuk a 
problémát, amíg az triviális nem lesz, vagyis amíg összesen két valószínűségünk 
marad. Ezt n — 2 lépésben érhetjük el. Ezután az összevonások megfordításával, 
mindig a megfelelő kódszó kétféle kiegészítésével újabb n — 2 lépésben felépítjük 
az optimális kódot, a Huffman-kódot. A következő példában nyomon követhetjük 
az algoritmus egyes lépéseit. 


1.4. példa. Legyenn— 5 és p(x1) — 0.4, p(x2) — 0.3, p(x3) — 0.15, p(x4) — 
0.1, p(x5) — 0.05, és keressük meg az ehhez tartozó Huffman-kódot: 

Az egyes lépéseket az oszlopok számozása jelzi balról-jobbra, az összevoná- 
sokat a nyilak mentén lehet nyomon követni. 


1. 2. 3. 4. 
0.4 0.4 0.4 0.4 
0.3 0.3 0.3 c 0.6 
0.15 0.15 6 0.3 7 
0.1 ac 0.15 7 
0.05 7 


A 0.4 és 0.6 valószínűségek optimális prefix kódja nyilván a 0 és az 1 (vagy 
fordítva). Az összevonások megfordításával elvégezhetjük a Huffman-kód felépí- 
tését. A valószínűségek mellett szögletes zárójelben az egyes lépésekben kapott 
kódszavak állnak. 


4 3. 2 1 
0.4 [0] 0.4 [0] 04 [0] 04 [0] 
0.6 [1] — 0.3 [10 0.3 [10] 0.3 [10] 
N 0.3 [11] — 0.15 [110] 0.15 [110] 
N. 0.15 [III] — 0.1 [1110] 
N. 0.05 [1111] 


Tehát f(x) sŰ, f(x2) — 10, f(x3) —- 110, f(xa) - 1110, f(x5) -IIII. 
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Az előzőekben feltételeztük, hogy ismerjük a bemenet eloszlását. Ez azonban 
nincs mindig így, ekkor az eloszlást a relatív gyakoriságokkal kell becsülnünk. 


A gyakorlati problémák során általában adott a Z7, . . . Zy bemeneti sorozat 
N 

(szöveg, fájl), amelyet szeretnénk optimálisan kódolni. Feladatunk a Y If(Z;)! 
í—1 


minimalizálása, vagyis az optimális f TOCOISTÉSSYENY megválasztása. Ez egyen- 


értékű a kódszóhosszak átlagának, 5; b If(Z)l-nek a minimalizálásával. 


Belátjuk, hogy - 3 If(Z)l— EwIf(2)I, ha a várható értéket az empirikus el- 
i—1 
oszlás szerint vesszük, tehát a forrásbetűk valószínűségét a relatív gyakoriságuk- 


N 
kal definiáljuk: pwy(xj) — y 2 Trz—xjy ahol Ir) az indikátor függvény. Nyilván 
i—1 


I 
Diz 


Exlf(2)I Pn(xj)lfCcj)l — 


s. 
II 
jen 
— 


! 
Pi 
Diz 


ag Mg) f(x) — 


s. 
] 
T 





ID 


42—) fepl- 


z]- 


z]- 


(A gyakorlatban magát a kódoló függvényt is le kell írni, át kell vinni a de- 
kódolóhoz, és ez a , fejléc" így a fentinél nagyobb átlagos kódszóhosszat ered- 
ményez. Az aszimptotikus vizsgálat során azonban ettől a konstans költségtől 
eltekinthetünk.) 

A Huffman-kódolás fenti algoritmusát csak két lépésben tudjuk végrehajtani. 
Először meghatározzuk a forrásbetűk relatív gyakoriságát, ami az előzőek értel- 
mében megegyezik a valószínűségekkel, majd ennek felhasználásával elvégezzük 
a tényleges kódolást. Nem mindig engedhető meg azonban olyan nagy mértékű 
késleltetés, hogy csak az összes bemeneti adat megérkezése után kezdünk hozzá 
a kimenet előállításához, másrészt a kétmenetes beolvasás akkor is lassítja az al- 
goritmust (bár kétségkívül optimális kódot eredményez), ha a bemenet már ren- 
delkezésre áll. A gyakorlatban ezért sokszor érdemes , egymenetes" algoritmust 
használni. Így az optimalitás rovására időt takaríthatunk meg. Egy forrásbetűt 


2 


az előző forrásbetűk előfordulásai alapján kódolunk, s ezzel együtt lépésenként 


változik maga a kód is. Tehát az aktuális forrásbetű kódolását egy, az előzőleg 
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feldolgozott forrásbetűkre optimális kóddal hajtjuk végre. Ezt az eljárást adaptív 
Huffman-kódolásnak nevezzük. 

A Huffman-kódot bináris faként is ábrázolhatjuk. A leveleket a forrásszimbó- 
lumokkal címkézzük, az éleken pedig a kódábécé ((0, 1 )) elemei szerepelnek. A 
csúcsokban a relatív gyakoriságok állnak. Egy forrásszimbólumhoz tartozó kód- 
szót úgy kapunk meg, hogy a fa gyökerétől a megfelelő levélig húzódó út élein 
szereplő kódbetűket sorban összeolvassuk (konkatenáljuk). A Huffman-kódolás 
szemléletesen úgy történik, hogy kiindulásként felvesszük a forrásszimbólumok- 
hoz tartozó leveleket, a csúcsokba a forrásszimbólumok relatív gyakoriságait ír- 
juk, majd lépésenként mindig a két legkisebb értéket tartalmazó csúcs fölé teszünk 
egy új csúcsot (szülőt), s ebbe a két régi érték összegét írjuk. Az eljárás végén ki- 
alakul az összefüggő fa, melynek a legutolsó lépésben megkapott csúcsa lesz a 
gyökér. 

A bináris Huffman-fában a relatív gyakoriságok szerepelnek. Adaptív Huff- 
man-kódolás esetén ezek helyett a gyakoriságokat használhatjuk (hiszen utóbbi- 
akat a bemenet hosszával elosztva megkapjuk a relatív gyakoriságokat, és szá- 
munkra csak az értékek egymáshoz való aránya érdekes). Két összevont betű 
szülőjének súlyát a szokásos módon, a két gyakoriság összegeként kapjuk. 

Amennyiben a fa testvér (vagyis közös szülővel rendelkező) pontpárjait a gyö- 
kértől a levelek felé haladva fel tudjuk sorolni súlyuk szerint nemnövekvő sor- 
rendben, a fa rendelkezik a testvérpár tulajdonsággal (sibling pair property). Be- 
bizonyítható, hogy egy Huffman-fa akkor és csak akkor optimális, ha rendelkezik 
a testvérpár tulajdonsággal. 


1.5. példa. Az 1.3. ábrán látható fára teljesül a testvérpár tulajdonság. A párok a 
következők: 


(28,18); (15,13); (11,7); (7,6); (6,5); (4,3); (8.2); 2.2); 2.1 
Ezek nemnövekvő rendezése: 


28218215213211272726262 





eszi zzzszzészézedezei 





Az 1.4. ábra kódfájának párjai: 
(3,1); (2.1); (1.1) 


Ezeket nem tudjuk megfelelően sorba rendezni, így nem teljesül a fára a testvérpár 
tulajdonság. 
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1.3. ábra. Kódfa, amelyre teljesül a testvérpár tulajdonság. 


1.4. ábra. Kódfa, amelyre nem teljesül a testvérpár tulajdonság. 


Az adaptív algoritmus lépései a következők: 
Ismerjük a forrásszimbólumokat: X — (a1, a2 , . . . , akt. Kiindulásként felépítünk 
egy olyan Huffman-fát, amelyben — ha nincs információnk a betűk előfordulásá- 
nak valószínűségéről — minden forrásszimbólum azonos, 1 gyakorisággal szere- 
pel. Így egy kiegyensúlyozott bináris fát kapunk. (Ha ismerjük a kezdeti eloszlást, 
megtehetjük, hogy erre építjük fel az adaptív algoritmus kiindulási fáját.) Elküld- 
jük a dekódolónak sorrendben (pl. a gyökértől a levelek felé, szintenként, balról 
jobbra) a lehetséges forrásszimbólumokat, amelyből az szintén felépíti a kiindu- 
lási Huffman-fát. (Ügyelni kell arra, hogy a kódoló és a dekódoló azonos algorit- 
must használjon.) A kódolás során beolvassuk a k-adik forrásszimbólumot. Ezt a 
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korábban beolvasott k — 1 betű feldolgozásával kialakult, lokálisan optimális kód- 
fával kódoljuk, majd eggyel növeljük a forrásszimbólum gyakoriságszámlálóját. 
Aktualizáljuk a fát, vagyis megvizsgáljuk, hogy fennáll-e még a testvérpár tulaj- 
donság. Amennyiben nem, helyreállítjuk, így biztosítva az optimalitást. Ezeket a 
lépéseket a dekóder is elvégzi, tehát a következő kódbetű dekódolásakor ugyan- 
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azt a fát fogja használni, mint amelyet a kódoló használt annak előállításakor. A 


22 


(k 3-1)-edik betű beolvasása után az előzőekhez hasonlóan folytatjuk. 
A következő két szabály használható a fa aktualizálása során a testvérpár tu- 
lajdonság helyreállítására: 


1. Két, azonos súlyú csúcs a hozzá tartozó részfákkal együtt megcserélhető. 
Ez természetesen nem befolyásolja a súlyokat. 


2. Két levél a súlyukkal együtt megcserélhető. 


A szabályok kombinálásával átalakítható egy nem megfelelő kódfa egy olyanná, 
amely teljesíti a testvérpár tulajdonságot. 

Ügyelni kell arra, hogy hosszú bemenet esetén előfordulhat a szimbólumok 
gyakoriságszámlálójának túlcsordulása. Ezt megfelelő technikával orvosolni kell. 


4 € (6) 
22 2 0 2 
A c D A c D A c D 


B B B 


- 
ty 
- 
ty 


1.5. ábra. Az 1.6. példa kódfájának alakulása. 
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1.6. példa. A bemeneti ábécénk: X — (A, B, C, DJ. Adaptív Huffman-kóddal kó- 
doljuk a beérkező forrásszimbólumokat, melyek legyenek a kövekezők: DCDA. 
Az 1.5. ábrán követhetjük nyomon a kódfa alakulását. Látható, hogy a testvérpár 
tulajdonság az DCD feldolgozása után sérül, a D gyakoriságszámlálójának 3-ra 
növelésével. Ekkor az 1. majd a 2. szabály alkalmazásával állíthatjuk helyre a fát, 
majd ezzel kódolható az utolsó, A szimbólum. 


1.4. Aritmetikai kódolás 


Az 1.3. tétel szerint prefix kódok használatával (például Huffman-kódolással) el- 
érhető, hogy EIJf(X)I c H(X) 3-1. Tehát karakterenként akár 1 bitet is veszíthe- 
tünk a tömörítés alsó korlátjához képest. Ezen blokkonkénti kódolással segíthe- 
tünk, ilyenkor ugyanis az 1.3. következmény értelmében ZEIf(X)I c 4H(X) 
e ahol m az X üzenetvektor hossza. Látható, hogy minél nagyobb m-et válasz- 
tunk, annál kisebb lesz a veszteség. Azonban korlátozva vagyunk m kiválasztásá- 
ban, ugyanis Huffman-kód esetén a kódszó elküldése csak a teljes m hosszú blokk 
beolvasása után lehetséges, és emiatt nagy m esetén jelentős késleltetés keletkez- 
het. Továbbá a kód bonyolultsága — azaz a kódoló- és dekódolótáblák mérete, a 
Huffman-kód fejléce — m növelésével exponenciálisan nő, és ez praktikus szem- 
pontból is korlátot állít m növelése elé. Erre a problémára ad megoldást az arit- 
metikai kódolás, melyet kifejezetten blokkonkénti kódoláshoz alkalmaznak, és 
jellegzetessége, hogy valós időben történik a kódszó előállítása és visszafejtése, 
tehát nem lép fel jelentős késleltetés, axármilyen hosszú blokkokat is kódolunk. 

Az aritmetikai kódolást itt végtelen pontosságú lebegőpontos aritmetikával 
mutatjuk be. A gyakorlatban természetesen csak véges pontosságú aritmetikák 
léteznek. A módszer ezeken is implementálható, mint majd később látni fogjuk. 

A kódszó előállításához először vesszük a [0,1) intervallumot, majd a for- 
rásábécé minden eleméhez ennek egy részintervallumát rendeljük olyan módon, 
hogy ezek a részintervallumok teljesen lefedjék az eredeti intervallumot, továbbá 
diszjunktak legyenek (vagyis partíciót alkossanak), és méretük legyen arányos a 
hozzájuk rendelt forráskarakter valószínűségével. 

Ilyen feltételeket teljesít például a következő hozzárendelés: 





x [di—1. di), 
ahol 


i 
d0—0, — 41— YP(X—xj), 1£ign, 
j—1 


n pedig a kódábécé elemszáma. 
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di-—1 di 








A 


1.6. ábra. Az intervallum felosztása aritmetikai kódolás során. 


Következő lépésként válasszuk az üzenet első karakterének megfelelő inter- 
vallumot. Folytassuk az eljárást úgy, hogy most ezt a kiválasztott intervallumot 
vágjuk részekre, ugyanúgy mint az előző lépésnél, majd válasszuk ki az üzenet 
második karakterének megfelelő részintervallumot, és az eljárást ezzel folytassuk 
tovább. 

Látható, hogy az így kapott egymásba skatulyázott intervallumsorozat utolsó 
eleme egyértelműen meghatározza az előtte lévőket, és emiatt az utolsó elemből 
a teljes üzenet visszafejthető. Ez lesz maga a kódszó. 

A gyakorlatban nem az intervallum alsó és felső határa, hanem egy tetszőle- 
gesen választott eleme adja a kódszót. Ebből is visszaállítható ugyanis az üzenet. 


Bebizonyítható, hogy az x üzenetblokkhoz tartozó elemet elég [og 59] -I1 bit 


pontossággal leírni — ilyen pontosság mellett az eredeti üzenetblokk rekonstruál- 
ható lesz. Ebből megkapható egy k katarteres blokkhoz tartozó kódszó hosszának 
várható értéke: 


F( [ogzzg l 1) — Hp) foggal -H1c 


N 
D1 
mg 
e 

o 
va 
-k 

SI 

-k 

! 


! 
Bos 
28 
-- 
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Ha az X üzenetvektor komponensei független azonos eloszlásúak, akkor 
H(X) — kH(X1), tehát a betűnkénti átlagos kódszóhosszra 


LELTOOL SH 42, 


30 1. VÁLTOZÓ SZÓHOSSZÚSÁGÚ FORRÁSKÓDOLÁS 


azaz a k blokkhossz növelésével tetszőlegesen megközelíti H(X1)-et. Fontos, 
hogy ellentétben a blokkonkénti Huffman-kódolással itt a bonyolultság nem nő 
a blokkok hosszának növelésével. 

A valós idejű működés lehetőségét az teremti meg, hogy a kódszó eleje (tehát 
a legutolsó intervallum tetszőlegesen kiválasztott elemének bináris tört ábrázolás- 
ban vett első néhány bitje) már az első néhány forráskarakterből meghatározható. 

Fixpontos aritmetikán történő implementációnál épp ezt használjuk ki. Ilyen- 
kor ugyanis a kódolás során az intervallum alsó és felső határát tároljuk fix pon- 
tossággal. Mivel az intervallum egyre rövidül, ezek egyre közelebb kerülnek egy- 
máshoz. Emiatt ezek magasabb helyiértékű bitjei egyezni fognak. Ilyen egyezés 
esetén az egyező részt átküldjük a dekódolóba, és a maradék különböző részeket 
felskálázzuk. Így mindig az aritmetika teljes pontossága áll a rendelkezésünkre, 
továbbá az átküldött bitmintából a dekódolóban hasonló skálázásos módszerrel az 
üzenet visszaállítható. 


1.5. Az entrópia néhány tulajdonsága 


Ebben a szakaszban megadjuk az entrópia néhány lényeges tulajdonságát amelye- 
ket a későbbiek során gyakran fel fogunk használni. 
Legyenek X és Y valószínűségi változók, amelyek a véges X illetve y halmaz- 


ból veszik értékeiket. x c X és y e 4 esetén a következő jelöléseket használjuk: 

x) — P(X—x) 
y) — RíY—y 

pixy) — MX-xY-yj 
y) 
x) 


P(X—x]Y—y) 
— P(Y—yIX—-x]. 
1.6. tétel. 


a) Ha az X valószínűségi változó n különböző értéket vehet fel pozitív való- 
színűséggel, akkor 
0 S H(X) £logn, 


és a bal oldalon egyenlőség akkor és csak akkor áll fenn, ha X 1-valószínű- 
séggel konstans, a jobb oldalon pedig akkor és csak akkor, ha X egyenletes 
eloszlású, azaz p(xi) — k, TEL eszi 


b) X és Y diszkrét valószínűségi változókra 


H(X,Y) c H(X) 1 H(Y), 
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és az egyenlőség szükséges és elégséges feltétele X és Y függetlensége. 
(H(X,Y) az (X,Y) valószínűségi változópár együttes eloszlásához rendelt 
entrópiát jelöli.) 


c) Az X tetszőleges g(X ) függvényére 
H(g(X)) S H(X), 


és Itt az egyenlőség szükséges és elégséges feltétele az, hogy g invertálható 
legyen. 


BIZONYÍTÁS: 


a) A bal oldali egyenlőtlenség triviális (lásd az 1.3. definíció utáni megjegy- 
zést), a JóRb oldalit a Jensen-egyenlőtlenség 1.2. a) következményét a p; — 
P(x), d: — -, 1— 1, . . . n szereposztásban felhasználva kapjuk: 


E, 


n 


n 
- Ép (xi) log p(xi) C — 2Pt Xi log — logn. 
i—1 


b) Az állítás rövid átalakítás után a következő alakba írható: 


— E play) logp(x,y) S -DPptwy) logp(x)pG) 


(felhasználtuk, hogy E p(x,y) — p(x) illetve E p(x,y) — p(y)), és itt megint 
Xx 


y 
alkalmazhatjuk a Jensen-egyenlőtlenséget. Egyenlőség akkor és csak akkor 
áll, ha p(x,y) — p(x)p(y) minden x,y-ra ami X és Y függetlenségét jelenti. 


c) Az állítást az 1.4. következménynél bizonyítjuk. HI 


MEGJEGYZÉS: Mint az az entrópia tulajdonságaiból kitűnik, egy valószínűségi 
változó entrópiája úgy fogható fel, mint az általa reprezentált véletlen kísérlet 
kimenetelének bizonytalansága. Így például nulla az entrópiája (a , bizonytalan- 
sága") a biztosan bekövetkező eseményt reprezentáló 1-valószínűséggel konstans 
valószínűségi változónak, és maximális az entrópiája a , legbizonytalanabb kime- 
netű" egyenletes eloszlású valószínűségi változónak. Sok hasonló analógia ta- 
lálható még, de nem szabad elfelejtenünk, hogy az ilyen érvekkel alátámasztott 
gondolatmenetek nem bizonyítások. Az entrópia igazi jelentőségét a kódolási té- 
telekben játszott alapvető szerepe adja. 


Az 1.6. szakaszban megismerjük az információforrás fogalmát, és ennek egyér- 
telműen dekódolható kódolását változó szóhosszú kódokkal. Ehhez szükségünk 
lesz a feltételes entrópia bevezetésére. 
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1.5. definíció. X-nek az Y feltétellel vett feltételes entrópiája a következő: 


H(XIYY—-—Y FpeDlogpí ly). (1.13) 
yegyxexXx 


MEGJEGYZÉS: 


a) A feltételes entrópia (1.13) kifejezését átalakítva azt kapjuk, hogy 


HXIY)—-—Y pw) E pelyDlogpíx [y), 
yey xeXx 


amiből látható, hogy H(X ] Y) az X valószínűségi változó Y — y feltételek- 
kel vett feltételes eloszlásaihoz tartozó 


H(XIY-y—-—) pelüdlogpe]y) 
xeX 


típusú entrópiáinak várható értéke. 


b 


sé 


Mivel az 1.5. definícióban csak X és y végességét kötöttük ki, a feltételes 
entrópia definícióját véges értékkészletű valószínűségi vektorváltozókra is 
kiterjeszthetjük. Legyen X — (XI, . . . ,Xx) és Y — (TV, . . . , fn), ahol az X;-k 
és Y;-k véges halmazokból veszik értékeiket. Ekkor 
H(XIY) — H(X,....XxIF.....Ym) 
— —ENPgYDlogpíx ly), 
y x 


ahol x— (xi, . . . xx) és y — (y1, . . . , Ym) minden lehetséges értékére kell ösz- 
szegezni. 


1.7. tétel (A feltételes entrópia tulajdonságai). X , Y, Z legyenek véges értékkész- 
letű valószínűségi változók. Ekkor 


a) 
H(X,Y) — H(Y) 4 H(XIY)—H(X) 4H(Y IX). 
b) 
0 c H(XIY) S H(X), 


és a bal oldalon egyenlőség akkor és csak akkor teljesül, ha X 1-valószí- 
nűséggel függvénye Y-nak, a jobb oldali egyenlőség akkor és csak akkor 
teljesül, ha X és Y függetlenek. 
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c) 
H(XIZY) SH(XI2), 
és egyenlőség akkor és csak akkor áll, ha p(x I z,y) — p(x I z) minden olyan 


x,y,z-re amelyre p(x,y,z) 5 0, ami azt jelenti, hogy X és Y feltételesen 
függetlenek, ha Z értéke adott (azaz X,Z,Y egy Markov-lánc). 


d) AZY valószínűségi változó minden f függvényére 
H(XIY) SHXIf(W)), 


és egyenlőség pontosan akkor áll fenn, ha minden rögzített z-re p(x [y) — 
P(X —x] f(Y) — z) minden x-re és y-ra, amelyre f(y) — z és p(y) 5 0. 


az ún. láncszabály segítségével: 


HC.) — HOGY HOG] XD HOS [X1.X2) e 
4 H(Xn I XI... .,Xn-1). 


BIZONYÍTÁS: 
a) 
H(XY) — — E YE Pey)logpk,y) — 

yeyxex 

- — YE E pPewY)log(pe]ly)p()) — 
yeyxex 

- —-)Y F.pGylogr9W)— E E peyDlogpí ly) — 
yEYxEX yegxex 


H(W)-HE IY), 

mert E p(x,y) — p(x). A H(X,Y) — H(X) --H( ] X) egyenlőség a bizo- 
yeg 

nyítás szimmetriájából következik. 


b 


Me 


A bal oldali egyenlőtlenség az entrópia 1.6. a) tulajdonságából és az 1.5. 
definíció utáni megjegyzésből következik. H(X ] Y) — 0 pontosan akkor, 
ha H(X IY —y) — 0 minden olyan y-ra, amire p(y) 5 0, vagyis akkor, ha 
minden ilyen y-ra p(x ] y) — 1 pontosan egy x-re. Ez azt jelenti, hogy X az 
Y függvénye (1-valószínűséggel). 

A jobb oldali H(X ] Y) £ H(X) egyenlőtlenség az a) tulajdonság szerint 
ekvivalens a H(X,Y) c H(X) 1 H(Y ) egyenlőtlenséggel, amit az 1.6. b) 
pontban bebizonyítottunk. 
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c) Az állítás ekvivalens a következővel: 


-Epbw2) (Epe Iy,2) og ) 50, 


p(x]y.2) 


amit könnyen beláthatunk, ha észrevesszük (Jensen-egyenlőtlenség), hogy 
a zárójelben levő összeg minden y, z-re nempozitív. Az egyenlőség feltétele 
a szokásos módon következik. 


d) Mivel 
P(f(Y)—zj— d po) 


y: fly)—z 


P(X—x,frW)—zy— BY PG.) 


y: f(y)—z 


ezért a Jensen-egyenlőtlenség 1.2. b) következménye szerint 


BESE ez s 





—P(X —x,f(Y) —zjog 





PÍf(Y)—zj 
(x,y) 
ez jsz (x, ) lo . , 
ae s po) 


amit minden z-re és x-re összegezve megkapjuk az állítást. Az egyenlőség 
P(x) 
pW) 
amelyre f(y) — z, és a konstans nyilván egyenlő 


P(X—x]f(Y) —zj)-vel. 





feltétele az, hogy rögzített z-re — p(x ly) — konstans minden y-ra, 
e) Az a) tulajdonság szerint 
H(X7 , . ús Xn) 7 H(XI , . ; . ,Xn-1) 3H(X, I XI, 44 ,Xn-1), 


amelyből az eljárást tovább folytatva az állítás teljes indukcióval követke- 
zik. .) 


1.4. következmény. Adósak vagyunk még az 1.6. tétel c) állításának igazolásá- 
val, vagyis azzal, hogy az X valószínűségi változó tetszőleges g függvényére 


H(g(X)) SH(X), 


és az egyenlőség akkor és csak akkor áll fenn, ha g invertálható. 
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BIZONYÍTÁS: Az 1.7. tétel a) és b) pontja szerint 
H(X,8(X))— H(g(X))-H(X 1 8(X)) 2 H(8(X)), (1.14) 


és a jobb oldalon egyenlőség pontosan akkor van, ha X a g(X) függvénye, vagyis 
ha g invertálható. De 1.7. a)-t és b)9-t újra használva, azt is tudjuk, hogy 


H(X ,8(X))— H(X) 3 H(g(X) IX) — H(X), 


és ebből (1.14)-gyel együtt következik az állítás. ha 


1.6.  Információforrások változó szóhosszúságú 
kódolása 


Az információforrást X betűvel jelöljük, és az XI , X. , . . . valószínűségi változók 
végtelen sorozatával modellezzük, azaz a forrás az i-edik időpillanatban az X; je- 
let bocsátja ki. Az X; valószínűségi változók mindegyike ugyanabból a véges 
tisztikai tulajdonságaival jellemezzük, vagyis adottnak vesszük, ha minden véges 
dimenziós eloszlását ismerjük. Egy X forrást emlékezetnélkülinek vagy memória- 
mentesnek mondunk, ha az Xi , X2 , . . . valószínűségi változók függetlenek. Az X 
forrás stacionárius, ha X7 , X2 , . . . stacionárius sztochasztikus folyamat, vagyis ha 
az X1,X2 , . . . , Xn ÉS az Xr4.1, Xk-42 : : : ) Xk-3-n valószínűségi változók együttes elosz- 
lása megegyezik minden pozitív n-re és k-ra, tehát a véges dimenziós eloszlások 
az , időeltolásra" invariánsak. Az X stacionárius forrás ergodikus, ha tetszőleges 


n 
f(x. . . . ,Xx) függvényre az z E FE.Xis1 , . . . , Xi3k-1) 1-valószínűséggel konver- 
i-— 


gál az Ef(XI , . . . , X4) várható értékhez, amennyiben az véges. 

A kódoló a forrás által kibocsátott szimbólumokat a csatornán átvihető szim- 
bólumokká alakítja. Jelöljük a csatorna által használt szimbólumok véges, s5- 
elemű halmazát y-nal (kódábécé). Ebben a szakaszban az előzőekben megismert 
egyértelműen dekódolható kódokat használjuk, betűnkénti, illetve blokkonkénti 
kódolással. A kódolás során a forrás által produkált szimbólumsorozatot k-hosszú 
blokkokra vágjuk (betűnkénti kódolásnál k — 1), és a blokkokat változó szóhosz- 
szú kódolással (pl. prefix kód) kódoljuk. A kapott kódszavakat egymás mellé írva 
kapjuk a csatornán továbbítható kódjelsorozatot. 

Feltesszük, hogy a használt kód egyértelműen dekódolható (lásd az 1.1. defi- 
níciót), így a felhasználó visszakapja a forrás üzenetét. A kód kiválasztásánál az a 
célunk, hogy L, az egy forrásbetűre eső átlagos kódszóhossz minél kisebb legyen. 

Tételezzük most fel, hogy az X — XI , X2 , . . . emlékezetnélküli és stacionárius, 
vagyis az XI, X2 , . . . független, azonos eloszlású valószínűségi változók sorozata. 
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Legyen f : X — Yy" egyértelműen dekódolható kód, és kódoljuk X-et betűnként 
f-fel. Ekkor egy k-hosszú üzenetet kódolva a betűnkénti átlagos kódszóhossz az 
X;-k azonos eloszlása miatt független k-tól: 


L-E(YXDI 4 F(X — ELX) 


Az 1.2. tétel szerint 





(1.15) 


ahol s a kódábécé elemszáma, H(X ) pedig az Xi — és az azonos eloszlás miatt 
minden X; — entrópiája. Az ilyen forrás betűnkénti kódolással való , tömöríté- 
sére" tehát elvi korlátot kaptunk. Másfelől viszont tudjuk (1.3. tétel), hogy van 
olyan f prefix kód, amelyre 


H(X1) 
logs 





Elf(XDI c tl, 
tehát az alsó korlátot megközelíthetjük. Kódoljuk most X k-hosszú blokkjait 
egyszerre, vagyis használjuk az egyértelműen dekódolható f : X" — y" kódot. 


Ekkor az 1.2. tétel szerint 
s VEK ádó 
L7- —EIf(XI, . . . ,X)] 2 — LÁSS KSZSS 2 
§ k logs 


amiből az X;-k függetlensége miatt (1.12) szerint 


zt 
— logs 
következik, hasonlóan (1.15)-höz, tehát a blokk-kódolás nem módosította az alsó 
korlátot. Azonban az 1.3. következmény megmutatta, hogy ezt az alsó korlátot 
megfelelően nagy blokkhosszt alkalmazva tetszőlegesen megközelíthetjük, ugyan- 
is minden k-ra létezik olyan L betűnkénti átlagos kódszóhosszú f : X — y" prefix 
kód, hogy 
H(X 1 
(X.) at E (1.16) 
logs  k 





Amennyiben általánosabb információforrások kódolását akarjuk vizsgálni, szük- 
ségünk lesz a forrás entrópiájának fogalmára: 


1.6. definíció. Az X — XI, X. , . . . forrás forrásentrópiája a 


1 
H(X) - lim a(X1.22, . . . Xn) 


n7ao0 


mennyiség, amennyiben a határérték létezik. 
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242 


A következő tétel megmutatja, hogy egy stacionárius forrásnak mindig létezik 
az entrópiája. 


1.8. tétel. Ha az X — XI , X. , . . . forrás stacionárius, akkor létezik az entrópiája, és 
H(X) — lim H(X, ] X1,X2, sze XT): 
n7oo 


BIZONYÍTÁS: Az 1.7. e) tulajdonságból 


1 1 s 
mH(X1.X2, . . . Xn) — 3 [oO 8.28.ssfr1)) j (1.17) 

i—2 
Másrészt a forrás stacionaritása miatt 


H(X; I X1..£2.,  . ., X—1) hez H(Xi41 I X2,X3, . . . ,X) 2 
2 H(XisalX1.22, . . . ,X) 





ahol az egyenlőtlenség az 1.7. c) tulajdonság következménye. 
Így a H (Xn I X1..X2., . . . ,Xn—1) sorozat n-nel monoton csökkenő és nemnegatív, 
tehát létezik a H — Jim H(Xn I Xi... X2 , . . ., Xa—1) határérték. 
A bizonyítás második felében szükségünk lesz az egyszerűen bizonyítható 
Toeplitz-lemmára, amely azt mondja ki, hogy ha az fa, ) valós számsorozat a vé- 
1 n 


ges a számhoz konvergál ( lim an — a), akkora b, — 5 2 ax sorozatnak is ugyanez 
n—o0 Es 
az a szám a határértéke. A Toeplitz-lemmát az a, — H(X, I X1, X2 , . . . , Xn-1) Sze- 


reposztásban felhasználva, (1.17)-ből azt kapjuk, hogy 


1 
lim —H(X ,X , . § . Xn) — lim H(Xn IX1.£2 ő ,Xn—1). 
nao0 


noch 
Ekkor viszont (1.17) szerint az 2H (X1..X2 , . . . , Xn) sorozat is monoton csökkenő. 
HI 


MEGJEGYZÉS: Ha X emlékezetnélküli és stacionárius, akkor a forrásentrópia 
létezése triviális, hiszen felhasználva az entrópia tulajdonságát, valamint az X;-k 
függetlenségét és azonos eloszlását, azt kapjuk, hogy 
H(X) — lim -H(X1,X2,...,X) — Him - Y H(X) — H(XI) 
— um — gk - im — ; ) — v 
EEYEA 1542; An naon E i 1 
A forrásentrópia fogalmát felhasználva már kimondhatjuk a változó szóhosz- 
szúságú kódolás tételét stacionárius forrásokra: 
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1.9. tétel. Ha az X — XI , X2 , . . . stacionárius forrást k-blokkhosszal blokkonként 
kódoljuk az f : X" - 4" egyértelműen dekódolható kóddal, akkor a kód L betűn- 
kénti átlagos kódszóhosszára mindig fennáll az 


H(X) 
— logs 
egyenlőtlenség. A k blokkhosszt elég nagyra választva létezik olyan f kód, amely- 


nek L betűnkénti átlagos kódszóhossza tetszőlegesen megközelíti ezt az alsó kor- 
látot. 


BIZONYÍTÁS: Az 1.2. tétel és az zH(Xi , X2, . . . , Xx) monoton csökkenő konver- 
genciája miatt 





1 1 H(X1,...,Xk) . H(X) 
L — —EJf(X,...,X4I2 5 

k XX Z k logs 7 logs 
tehát a tétel első felét beláttuk. Legyen most € - 0 tetszőleges valós szám és 
válasszuk ko pozitív egészet úgy, hogy 


1 € l e 
—H(AI1 , . . . ,X£x) —H(X —] 5. — a —. 1.18 
ko ( 1; , ko ) ( ) 2 2 o0gS, és ko mú 2 ( ) 


Mivel a Shannon-Fano-konstrukcióval (1.3. tétel) készíthetünk olyan f : Xs 
y" prefix kódot, hogy 


H(X , . . . .X.o ) 


E(If(X1. .. ..Xo)D c logs 


FI; 


ezért (1.18)-at felhasználva azt kapjuk, hogy 


1 
L - ka tgseág 18 
1 H(X,....X 1 
L ( 1; , ko) I £ 
ko logs ko 
H(X) e 1 





z 





z 





Mivel e tetszőlegesen kicsi lehet, ezzel megmutattuk, hogy a betűnkénti átlagos 
kódszóhossz alsó korlátját tetszőlegesen megközelíthetjük. HI 
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1.7.  Markov-forrás és entrópiája 


A forrásentrópia kiszámítása általános forrásokra sokszor reménytelen feladat. A 
következőkben a források egy olyan osztályát — a Markov-forrásokat — ismer- 
jük meg, amelyekre a forrásentrópiát sok esetben ki tudjuk számolni. Meg kell je- 
gyezni, hogy a Markov-források jelentőségét az adja, hogy segítségükkel gyakor- 
lati , információforrások" (írott szöveg, beszéd) modellezhetők kezelhető módon. 
A Markov-források ismertetését a Markov-láncok fogalmának felelevenítésével 
kezdjük. 
A Z21,22 , . . . valószínűségi változók Markov-láncot alkotnak, ha 


— P(Zr—zx 1 Zx-i — 24-i) (1.19) 


minden k 2 2-re és minden lehetséges z1,z2,...,zx sorozatra. A Z; értékeit a 
Markov-lánc állapotainak, az állapotok Z halmazát pedig a Markov-lánc álla- 
potterének nevezzük. Feltesszük, hogy IZ] — co, vagyis az állapottér véges. A 
Z1, 22, . .. Markov-lánc homogén, ha 


P(Z4—z2]12Z-1—z1t—P(Z2 —2]Z—z) 


minden Z1,Z2 € 2-re és minden k 2 2-re. Végül, egy Markov-lánc stacionárius, ha 
mint sztochasztikus folyamat stacionárius. 

A P(Z4 — z2 I Zx-1 — zi) átmenetvalószínűségek ismeretében a Markov-mo- 
dell jól használható szövegek és képek tömörítésére. Angol nyelvű szövegek 
entrópiájának meghatározására elsőként Shannon végzett kísérleteket. A nyelvi 
redundanciát modellezte Markov-láncokkal. A 26 betűs angol ábécét használó 
szövegek esetén másodrendű Markov-lánc modell használatával 3.1 bit/betű tö- 
mörítési arányt ért el. Ez 2.4 bit/betű-re szorítható le, ha betűk helyett szavak 
szerepelnek a modellben. Az angol nyelv entrópiájának becslésére Shannon kí- 
sérleti személyeket is alkalmazott a statisztikai modellek helyett. A résztvevők- 
nek a szöveg aktuális betűjét kellett kitalálniuk a megelőző 100 betűs környezet 
alapján. Így alsó határnak 0.6 bit/betű, míg felsőnek 1.3 bit/betű adódott. Mi- 
nél hosszabb környezetet vizsgálunk, annál jobb a jóslás eredménye, azonban a 


környezet hosszával exponenciálisan növekszik a lehetséges megelőző állapotok 
száma. 


1.7. példa. Egy fekete-fehér kép sorait modellezzünk egy (Z;) stacionárius for- 
rásként, az 1.7. ábrán látható homogén, stacionárius Markov-lánccal. S, állapot 
jelöli azt, hogy az aktuális képpont világos, míg S,, hogy sötét. p(v) a világos, 
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p(s]v) 


pív] 5) 
1.7. ábra. Egy fekete-fehér kép Markov-lánc modellje. 


p(5) a sötét képpont kezdeti valószínűsége. Az átmenetvalószínűségek közül pél- 
dául p(v I s) jelenti annak az eseménynek a valószínűségét, amikor egy sötét kép- 
pont után egy világos következik. 


Számítsuk ki egy tetszőleges Markov-lánc forrásentrópiáját: 


1 
H(Z) —  lim ma 22, szú Zn) ti 


na 


mivel Z stacionárius, ezért 


7 lim H(Zn [Z1erssZazi) ti 
n3o0 


de Z Markov-lánc is, ezért az (1.19) Markov-tulajdonság miatt 


— lim H(Z, [24-1) — 
na oo 


és Z stacionaritását újra felhasználva azt kapjuk, hogy 


szt lim H(Z2 121) 


na 


mzzi H(Z2 I 21) — 
— —Y NY plz zo)logpíza Iz) — 


2. AZ 


— — EY plz Izop(ízn logp(íz2 I 21): 


Al 22 


1.8. példa. Legyenek az 1.7. példa valószínűségei a következőek: 


p(s]5)— 0.88, p(v]s)—0.12, p(s]v)— 0.03, p(v]v)— 0.97 
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Ekkor a stacionárius eloszlás: 


p(s)— 0.2, p(v)— 0.8 
A Markov-lánc (vagyis az átmenetvalószínűségek) figyelembe vétele nélkül egy 
betű entrópiája: 
H(Z1) — —0.810g0.8 —0.210g0.2 — 0.722 


Ugyanez a modellünk szerint: 


H(ZIZ) — —-EN píz IzodpízDlogpíz I z1) — 


FANG 
—p(s 1 5)p(s)logp(s 159—p(v I 5)p(s) logp(v ] 5) 
—p(s [ v)p(w)logp(s Ív) —p(v I v)p(v) logp(v [ v) — 
—  —0.88-0.2:10g0.88 —0.12:0.2 :10g0.12 
—0.03 : 0.8 -10g0.03 — 0.97 : 0.8 -10g0.97 — 
0.261 


Látható, hogy nagyjából a harmadára csökkent az entrópia az átmenetvalószínű- 
ségek ismerete miatt. 


Számoljuk ki egy speciális Markov-lánc entrópiáját: 


1.9. példa. Jelöljük p;j-vel a P(Z2 — zj ] Z1 — z;j átmenetvalószínűséget, és 


legyen a [p;j] n x n-es mátrix olyan, hogy minden sora ugyanazon 41 , 42 , . . . , Un 
(u; 5 0, Eu; — 1) számok egy permutációja. Ekkor 
H(Z212)—-— E plz) E p(2 IzdDlogpízz I 20). 
zez nez 


Az átmenetvalószínűség-mátrix soraira vonatkozó feltétel miatt azonban 


— YE P(x IzDlogpíz2 I z1) — - E vulogui 
zez 


zi értékétől függetlenül, tehát 
H(Z I 21) — - E rilogin. 


Nézzük azt az esetet, amikor Z bináris, szimmetrikus Markov-lánc, azaz Z — 
(0, 1) és 


iz 
p1-] ú ül (0cpc1). 
1—-p p 
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Itt 

H(Z2 121)——plogp—(1— p)log(1— p) —: h(p). (1.20) 
A h(p) függvényt bináris entrópiafüggvénynek nevezzük. Ha PfZ1—0)j— gés 
P(Z1-1)j-— 1 ag, akkor a stacionaritás miatt a PÍZ; — 0) — g és PfZ2— 1) — 
1 — ag feltételeknek is teljesülniük kell, tehát 


[d 1-1] ú 42 lelt 1—a] 


1-p p 


amiből g — 3 következik, és így H(Z1) — 1. Megvizsgálva (1.20)-at észrevehetjük, 
hogy ha p közel van 0-hoz illetve 1-hez, akkor H(Z) — H(Z; I 21) értéke H(Z1 ) — 
H(Z2) — 1-nél, a lehetséges maximális értéknél sokkal kisebb. Ez intuitíve érthető 
ís, hiszen ha 





DP P(Z 0 ] Z1 0) P(Z 1 ] Z 1) 





1-hez közeli, akkor hosszú 0-s illetve 1-es sorozatokat várhatunk, míg ha 








1—p-P(f(Z2—1]Z1-—0)—PífZ2—0IZ—-—1) 
1-hez közeli, akkor a 0-k és 1-esek közel szabályos váltakozását várhatjuk. 


Az 1.8. példa átmenetvalószínűségei jellegzetesek egy túlnyomóan szöveget 
tartalmazó (pl. üzleti) dokumentum esetén. Megfigyelhető, hogy a következő kép- 
pont színe sokkal nagyobb valószínűséggel lesz azonos az előzőével, mint eltérő 
(különösen világos esetében). Ahelyett, hogy a képpontok színét külön-külön 
kódolnánk, kódoljuk egyszerűen az azonos színű képpontok (vagyis a futamok) 
hosszát, tehát azt a hosszt, amíg a Markov-lánc azonos állapotában maradunk. 
Ezt a technikát futamhossz kódolásnak nevezzük. (A futamhossz kódolás opti- 
malitására vonatkozóan lásd az 1.17. feladatot.) Például, ha 190 világos pixelt 30 
sötét követ, majd 210 világos jön, a 430 képpont egyenkénti kódolása helyett a 
190,30,210 sorozatot fogjuk kódolni, valamint jeleznünk kell azt, hogy az első 
pontsorozat milyen színű volt. 

Futamhossz kódolást alkalmaznak a CCITT (ma: ITU-T) fax-szabványaiban 
is. Számunkra a Group 3 illetve Group 4 ajánlások érdekesek, ugyanis a korábbi 
Group 1 és 2 technikák csak analóg módszereket használtak, ennélfogva nem tö- 
mörítettek. 

Az 1980-ban megjelent Group 3 szabvány egydimenziós futamhossz kódolás- 
sal dolgozik. Ez azt jelenti, hogy az egymás alatti vízszintes sorokat egymástól 
függetlenül kódolja, a futamok pedig az egy soron belül váltakozó fehér és fekete 
képpontokból állnak. Minden sor első futama fehér képpontokból áll; ha egy sor 
fekete pixellel kezdődik, akkor az első futamot egy 0 hosszúságú fehér futamnak 
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kell tekinteni. A különböző hosszúságú futamok eltérő valószínűséggel fordulnak 
elő egy dokumentumban, ezért ezeket változó szóhosszúságú kóddal, mégpedig 
a szabvány szerint Huffman-kóddal kódolják. A futamok összhossza, vagyis egy 
sor hosszúsága 1728 képpont. Ez túl sok lehetséges futamhosszt eredményez, 
nincs értelme ilyen nagyméretű kódkönyvet (- kódszavak halmaza) alkalmazni. 
Ezért a h hosszt 1 vagy 2 jegyű, 64-es számrendszerben felírt számként kódolják: 


h—64m-t 1—O1,....63 — m—01,...,27 


Külön kódtáblázat vonatkozik az n, vagyis a kiegészítő kód (make up code, MUC) 
illetve a t, vagyis a lezáró kód (terminating code, TC) értékeire, külön a fekete és 
külön a fehér képpontok esetére. Egy futam kódját a színnek megfelelő MUC 
illetve TC táblázatból kiolvasott kódszavak konkatenációja adja. Azonos szín- 
hez tartozó MUC és TC táblázatok prefix tulajdonságúak (együttesen is). Mivel 
a fekete és fehér futamok mindig váltakozva szerepelnek, ezért a fekete tábláza- 
tokban álló kódszavak lehetnek a fehér táblázatokban állók prefixei és fordítva. 
A sor végét a speciális EOL kódszó jelöli, ez biztosítja az adó és vevő közötti 
szinkronizációt Is. 

1984-ben publikálta a CCITT a Group 4 ajánlást, amely kihasználja a függő- 
leges irányú redundanciát is, emellett felülről kompatíbilis a Group 3-mal. Egy 
soron belül a futamokat nem csak a már megismert módon, a futamhosszak felso- 
rolásával kódolhatjuk, hanem a színátmenetek helyének pozícióival is. 

A kétdimenziós kódolás megértéséhez vezessük be az alábbi jelöléseket: 

ao: Az utolsó pixel, amelynek értékét a kódoló és a dekódoló egyaránt ismeri. 
Egy sor kódolásának megkezdésekor az ag egy képzeletbeli fehér képpontra mu- 
tat, amely az első aktuális pixel bal oldalán áll. 

a1: Az első színátmenetet jelentő képpont ag jobb oldalán. ai színe ellentétes 
ag színével. az helye csak a kódoló számára ismert. 

a: Az második színátmenetet jelentő képpont ag jobb oldalán. az színe ellen- 
tétes az színével, ami azt jelenti, hogy megegyezik ag színével. 

bi: Az első színátmenetet jelentő képpont az aktuálisan kódolandó sort mege- 
lőző sorban ag jobb oldalán, amelynek színe ellentétes ag színével. Mivel a meg- 
előző sor és ag értéke ismert a kódoló és a dekódoló számára is, ezért bi helye is 
ismert mindkettőjük előtt. 

b2: Az első színátmenetet jelentő képpont az aktuálisan kódolandó sort meg- 
előző sorban bi jobb oldalán. 

A Group 4 algoritmusa az első sort ugyanúgy kódolja, mint a Group 3 ese- 
tében láttuk. A további sorok kódolásához felhasználja az azt megelőzőt, így a 
másodikhoz az elsőt, a harmadikhoz a másodikat, stb. Az 1.8. ábra azt a helyzetet 
ábrázolja, amikor éppen a második sornál tartunk a feldolgozásban, és a képponto- 
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1.8. ábra. Az ag, a1, a2, bi, b2 mutatók lehetséges elhelyezkedése. 


kat a második pixelig már feldolgoztuk. A színátmenetet jelentő pixeleket ponttal 
jelöltük. Két esetet kell megkülönböztetnünk: 

Ha bi és b; ag és ai között fekszik, a kódoláshoz az átadó (pass) módot 
használjuk. A kódoló egy speciális kódszó kiküldésével értesíti a dekódolót er- 
ről. Ebből a dekódoló tudja, hogy az ao-tól a b2 alatti pixelig a képpontok színe 
azonos. Ha ez nem lenne igaz, akkor közben lenne egy színátmenetet jelentő kép- 
pont, vagyis ai és ba viszonyára nem lenne igaz a feltételünk. Ekkor a kódoló és 
a dekódoló által egyaránt ismert legutolsó képpont a b2 által mutatott lesz. Így ez 
lesz az ao új helye, a másik négy mutató új pozícióját pedig a már ismert módon 
jelöljük ki. 

Ha ai megelőzi b2-t, ismét két eset lehetséges: Ha ai és bi távolsága nem 
nagyobb 3-nál, elküldjük ezt a távolságértéket (ezt függőleges módnak nevezzük). 
(A kódszó természetesen függ attól, hogy ai jobbra vagy balra van-e b1-től, így itt 
összesen 7 eset lehetséges azt is beleértve, hogy az éppen D1 alatt helyezkedik el.) 
do-t a1-re állítjuk, módosítjuk a másik négy mutatót is, és folytatjuk a kódolást 
az algoritmus elejétől. Ha az és bi távolsága nagy, lényegében visszatérünk az 
egydimenziós technikához. Egy speciális kódszóval jelezzük a dekódernek, hogy 
vízszintes módban vagyunk, majd elküldjük ag és aj illetve az és az távolságát 
Huffman-kódolva. ao-t az helyére állítjuk, és aktualizáljuk a másik négy mutatót 
is. A kódolást az algoritmus elejétől folytatjuk. 

A kétdimenziós algoritmus használatával egy sor kódolása a megelőző soron 
alapul, így elképzelhető, hogy egy sorban bekövetkező hiba kiterjed a többire 
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1.9. ábra. Markov-forrás. 


is. Ezt megelőzendő, a szabvány rögzíti, hogy minden egydimenziós eljárással 
kódolt sort normál függőleges felbontás esetén legfeljebb 1, nagy felbontás esetén 
legfeljebb 3 kétdimenziós algoritmussal kódolt sor követhet. 

A sorvégeket a Group 3 szabványban megismert EOL szimbólum jelzi, azon- 
ban attól függően, hogy vízszintes módban, vagyis az egydimenziós Group 3 sze- 
rint kódoltuk a sort, vagy az új kétdimenziós módszerrel, egy 1 illetve 0 bit kö- 
veti. Ez lehetővé teszi, hogy mindkét módszerrel elvégezve a kódolást az adó a 
rövidebb hosszúságot eredményezőt választhassa ki, majd a megfelelő EOL jellel 


jelezze a vevőnek, hogy melyik algoritmust használta. 


A Markov-lánc modell általánosításaként vezessük be a Markov-forrást, amely 
egy stacionárius Markov-lánc emlékezetnélküli sztochasztikus leképezése. 


1.7. definíció. Legyen Z — Z1 , 22 , . . . egy homogén és stacionárius Markov-lánc, 
és legyen Y — Y1, Y , . .. egy emlékezetnélküli, stacionárius forrás, amely függet- 
len Z-től. Tegyük fel továbbá, hogy adott egy F(z,y) kétváltozós függvény. Ekkor 
az X; — F(Z;,Y;) leképzéssel definiált X — X , X2 , . . . forrást Markov-forrásnak 
nevezzük. 


Az 1.9. ábra a Markov-forrás származtatását szemlélteti. 
Mivel Z1, 22 , . . . és Y1, Y2 , . . . stacionáriusak és függetlenek, ezért az XI , X2 , . . . 
is stacionárius lesz, tehát létezik a H(X) — lim £H(Xi , X2 , . . . , X) forrásentrópia. 
no oo 
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Próbáljuk meg kiszámolni H(X)-et. A jól ismert összefüggés szerint (amelyet 
az 1.7. tétel a) egyenletének átrendezésével kapunk) 


Haz öjt st 
34H(XI, . . . ,Xn IZ1, Zn) 
HZ ésa e Is; (1.21) 


Vegyük sorra az egyenlőség jobb oldalán szereplő tagokat: 


a) Korábban már láttuk, hogy 


1 
lm —H(Z1, 22, . . . Zn) — H(Z2 121). (1.22) 
naon 
b) A H(XI,. . . ,Xn I Z1, . . ., Za) kiszámításához tekintsük a szóban forgó felté- 





teles valószínűségeket: 


P(Xi ZIXÜs sss 7 Xn IZ SZ szálni zh E 
— P(F(Z1,Y) — XI, ...,F(ZnYn) 7 Xn IZ ZZúeézszn EÚtT 7 
— P(F(zi,Y1) — xi, ....F(zn.Yn) — xn) — 


n 
-[ [PAR Y)— xi — 
i—1 
n 
— [ [PAP (2, YX;) — xi [ Z: — zi — 
i—1 
n 
- [PE — xi I Z2— zi). (1.23) 
i—1 
ahol a második és negyedik egyenlőségnél a (Z1, . . . , Zn) és az (Y1, .. . ,Yn) 
függetlenségét, ahharmadik egyenlőségnél pedig az Y;-k függetlenségét hasz- 
náltuk ki. Az egyszerűség kedvéért a szokásos jelöléseinket felhasználva 
az (1.23) szerint tehát 


n 
log p(x1,...,Xn I 21... Zn) — Ylogp(xi I zi), 


i—1 
és így 
H(Xisoz Xi IZis es Ze) — 


n 
mit )3 ) D(X1, Xn Ze. .sZn) 2. log p(i ] zi) — 


XISSSZÁSZÍSE ZA i—1 
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n 
-—) 9 ) D(X1, Xn, Z1, . . . Zn) log PC ] zi) — 


II XL a Azt reszen 


ey 


H(X IZ). (1.24) 


i—1 


Mivel az (X;, Z; ) párok eloszlása ugyanaz minden i-re, ezért (1.24)-ből 
1 
miT(X1 hr Xn 21 Zn) — H(XI I 21) (1.25) 


következik. 


c) A H(Z1,... Zn IX... . . , Xn) feltételes entrópiát általános esetben nem tud- 
juk kiszámolni. Nézzünk két speciális esetet, ahol ez a számítás nem okoz 
nehézséget: 


1. Legyen X; — Z;, vagyis F(z,y) — z minden y-ra, tehát a Markov-forrás 
kimenete a Z Markov-lánc állapotai. Ekkor 


H(Z1,... Za lX1.....Xn) — H(Z1,... Za lZ1.. 2) — 0, 


H(X; I Z;) — H(Z; I Z) — 0, 
tehát (1.22)-ből és (1.25)-ből (1.21) szerint 
H(X) — H(Z I 21), 


ahogy már korábban láttuk. 


2. Legyenek az F.(-) — F(z,:) függvények értékkészletei minden z-re 
diszjunktak, vagyis (az X;-k értékeinek halmazát X-szel, Y;-k értékei- 
nek halmazát 39-nal jelölve), ha 


A. —(xe X: x— F(z,y) valamely y € 4-ral, 


akkor 
Az NA —0, ha zi 422, és [JA —X. 
zez 


Ekkor nyilvánvalóan létezik olyan G függvény, hogy 


48 1. VÁLTOZÓ SZÓHOSSZÚSÁGÚ FORRÁSKÓDOLÁS 


hiszen ha X; € A; , akkor tudjuk, hogy Z; — z. Tehát a feltételes entrópia 
1.7. b) tulajdonsága szerint 


H(Z1,... ZalXi.....X1) — 
— H(G(X),..., G(X) IX... Xh) — 0, 


és így 
H(X) — H(Z 121)4-H(XI 121). 


A c) I. és 2. esetekben tehát kiszámíthatjuk a Markov-forrás entrópiáját ha ismer- 
jük a Z Markov-lánc állapotátmenetvalószínűség-mátrixát, az Yi eloszlását és az 
F függvényt. 

Meg kell jegyezni, hogy az X;-k feltételes eloszlásainak (1.23) tulajdonsága 
azt jelenti, hogy az YI , Yo , . .. és az F függvény együttesen egy diszkrét memória- 
mentes csatornát alkotnak, melynek bemenetei a Z;-k. A diszkrét memóriamentes 
csatorna fogalmával a 3. fejezetben foglalkozunk majd. 


1.8. Univerzális forráskódolás 


Az eddig vizsgált kódok alkalmazásakor az adó és a vevő között átvitelre kerülő 
bitek két csoportot alkotnak. Először átvisszük a blokk-kódot leíró információt. 
Ez egy állandó költséget jelent, független az üzenet tényleges hosszától. Majd 
következnek az üzenet kódszavai. Elméleti vizsgálataink során azzal a feltéte- 
lezéssel éltünk, hogy a továbbítandó üzenetünk végtelen hosszú. Ilymódon, a 
kódok aszimptotikus viselkedését tekintve, az állandó költség fajlagosan nullá- 
hoz tart, tehát elhanyagolható. A gyakorlatban azonban véges forrásokkal van 
dolgunk. Ebben az esetben az állandó költség akár nagyobb is lehet, mint az üze- 
net kódszavainak összhosszúsága. Ezt elkerülendő, jó lenne, ha rendekezésünkre 
állna egy olyan technika, amelynek nincs állandó költsége, de aszimptotikusan 
ugyanolyan jó tömörítési arányt ér el, mint a blokk-kódok. Az állandó költség 
abból adódik, hogy a kódot a forráson előzetesen elvégzett statisztikai vizsgála- 
tok (a forrásszimbólumok gyakorisága) alapján hozzuk létre, tehát ezek az adatok 
szükségesek a kód leírásához. Ehelyett járjunk el úgy, hogy menet közben gyűj- 
tünk információt a forrásszimbólumokról, vagyis az aktuális szimbólumot az ezt 
megelőző szimbólumok alapján kódoljuk. Az ilyen kódokat adaptív kódoknak 
nevezzük, alkalmazásuk során nincs állandó költség. Korábban találkoztunk már 
ilyen módszerrel az adaptív Huffman-kód kapcsán. A most tárgyalásra kerülő 
Lempel-Ziv-kódok is ebbe a családba tartoznak. 
Az első LZ-algoritmus az 1977-ben publikált LZ77. 
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Az LZT7 algoritmus 


A kódoló a forrásszimbólumok sorozatát egy hag hosszú csúszóablakon ke- 
resztül vizsgálja. Az ablak két részből áll: egy keresőpufferből, amely a legutóbb 
kódolt hk darab forrásszimbólumot tartalmazza, és egy előretekintő pufferből, 
amely a következő he darab kódolandó szimbólumot tartalmazza (ha — hr -- he). 
A kódoló a keresőpufferben megkeresi az előretekintő puffer első szimbólumával 
megegyező szimbólumokat. Ehhez egy hátrafelé haladó mutatót használ. Meg- 
nézi, hogy a megtalált pozíciókkal kezdődően, a keresőpufferben lévő szimbólu- 
mok milyen hosszan egyeznek meg az előretekintő puffer szimbólumaival, és a 
találatok közül azt választja ki, amelytől kezdve a leghosszabb az egyezés. A 
kódoló ezután elküld egy (z,h,c) hármast, ahol t a keresőpufferben megtalált 
szimbólum távolsága az előretekintő puffertől (offset), h a kereső- és az előre- 
tekintő puffer egyező szimbólumainak legnagyobb hosszúsága, c pedig az első, 
az előretekintő pufferben lévő nem egyező karakter kódszava. Azért küldjük el 
az első nem egyező karakter kódját is, hogy kezeljük azt az esetet, amikor az 
előretekintő puffer szimbólumait nem találjuk meg a keresőpufferben. Ilyenkor 
t és h értéke 0. Egy hármas kódolásához állandó hosszúságú kód használatá- 
val [logAk] -- [doghe ] -- [I/ogIXII bit szükséges, ahol IXI a forrásábécé mérete. 
Figyeljük meg, hogy az egyező szimbólumok hosszúságának átviteléhez nem 
[log Ax ], hanem [1og Ah. ] bit szükséges. Ennek oka, hogy az egyezés hossza meg- 
haladhatja a keresőpuffer hosszát, vagyis az egyező rész átlóghat az előretekintő 
pufferbe. 


1.10. példa. Legyen a bementünk a következő: 
. . cabracadabrarrarrad . . . 


ha :— 13, hr :— 7, he :— 6. — Tegyük fel, hogy az első néhány karaktert már kó- 
doltuk. Ekkor: 





cabracaldabrarlÍr a r r a d 


Látható, hogy az előretekintő puffer első karaktere, d, nem található meg a kere- 
sőpufferben. Átküldjük a (0,0, f(d)) hármast, ahol f(d) a d karakter kódját jelöli. 
Az ablakot eggyel jobbra mozgatjuk, így: 


tag 1 


clab ra c adlabr ar rla r r a d 


h-4 
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A mutatót a keresőpufferben hátrafelé mozgatva, az előretekintő puffer első szim- 
bólumával (a) egyező karaktert t — 2 távolságra találjuk meg. Ekkor az egyezés 
hosszúsága h — 1. Tovább haladva a mutatóval t — 4-nél szintén egy 1 hosszú 
egyezés adódik. Végül t — 7-nél találjuk meg a legjobb választást h — 4 hosz- 
szal. Tehát az abrar karaktereket a (7,4, f(r)) hármassal kódoljuk, és az ablakot 
5 pozícióval jobbra toljuk, így: 











t—-3 


Az első egyezést t — 1-nél hA — 1 hosszan találjuk. A második egyezés f — 3-nál 
van, hossza első ránézésre h — 3. Azonban az egyezés az előretekintő pufferbe is 
átnyúlik, ezért h — 5. Az átküldendő hármas: (3,5, f(d)). A dekódolás során ez 
az , átlógás" nem okoz gondot, mert az első három karaktert könnyen megkapjuk 


a már előzőleg dekódolt karakterekből, a maradék kettőt pedig az előbbi lépés 
során megkapott 3 karakter segítségével nyerjük. 


Láthatjuk, hogy az LZ77 egy rendkívül egyszerű adaptív algoritmus, amely 
nem igényel előzetes ismeretet vagy feltevést a forrásról. Megmutatható, hogy 
az eljárás hatékonysága aszimptotikusan (/x,he — co) megközelíti az optimális 
algoritmusét, amely előzetesen ismeri a forráseloszlást, azaz stacionárius és er- 
godikus forrás esetén az átlagos kódszóhossz konvergál 269 hez, ha hr, he — co. 
Bár ez aszimptotikusan igaz, a gyakorlatban az LZ277 számos továbbfejlesztése is- 
meretes, amelyek célja a hatékonyság növelése. Például a népszerű PKZIP és ARJ 
tömörítőkben a hármasokat nem fix, hanem változó hosszúságú kóddal kódolják. 
Egy másik variáció változtatható méretű kereső és előretekintő ablakot használ. 
Az LZT7 legegyszerűbb módosítása annak kiküszöbölése, amikor egyetlen karak- 
tert kódolunk egy hármassal. Ez egy jelzőbittel oldható meg. Ezzel jelezzük, hogy 
nem egy hármast, hanem csak egy kódszót küldünk át. 

Az LZ77 alkalmazása során a forrásszimbólumok legutóbb kódolt sorozatát 
hasznájuk, így azzal a feltételezéssel élünk, hogy a minták egymáshoz közeli in- 
tervallumokban visszatérnek (a mozgó ablakon belül). Szélsőséges esetben, ha 
az ismétlődés hossza éppen eggyel hosszabb a keresőpuffer méreténél, nem tu- 
dunk tömöríteni. Az LZ-algoritmus következő, 1978-as veriójánál (LZ78) ezt a 


problémát egy másfajta, adaptív szótár alapú rendszerrel oldják fel. 


Az L7Z78 algoritmus 


2 


A kódoló és a dekódoló is szótárt épít az előzőleg előfordult sorozatokból. 
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a kódoló szótár a kódoló szótár 
kimenete index bejegyzés kimenete index bejegyzés 
(0, f(d)) 1 d (4, f(c)) 10 bac 
(0, f(a)) 2 a (9, f(b)) 11 dabb 
(0,f(b)) 3 b (8, f(d)) 12 acd 
(3, f(a)) 4 ba (0, f(e)) 13 e 
(0, f(c)) 5 c (13,f(c)) 14 ec 
(1, f(a)) 6 da (1, f(e)) 15 de 
(3, f(b)) 7 bb (14,f(d)) 16 ecd 
(2, f(c)) 8 ac (13,f(e)) 17 ee 
(6, f(b)) 9 dab 


1.10. ábra. Az 1.11. példa LZ78 kódolásának menete. 


A kódoló megkeresi a forrásszimbólumok aktuális pozíciójától kezdődő leghosz- 
szabb egyezést a szótárban. Átküld egy (i, c) párt, ahol i az egyező karaktersorozat 
szótárbeli indexét jelöli, c pedig az első nem egyező karakter kódja, majd felveszi 
a szótárba az i indexű egyező karaktersorozat és a c karakter konkatenációjaként 
kapott sztringet (a következő szabad indexet adja neki). Ha nem talál egyező 
karaktersorozatot a szótárban, akkor a (0,c) párost küldi át, c itt is az első nem 
egyező karakter kódja, amely ebben az esetben természetesen az első feldolgo- 
zandó szimbólum. 


1.11. példa. Kódoljuk a következő sorozatot az LZ78 algoritmussal: 
dabbacdabbacdabbacdabbacdeecdeecdee 


Kezdetben a szótár üres, ezért az első 3 szimbólumot egyenként felvesszük a szó- 
tárba, és a 0 indexszel átküldjük: (0, f(d)), (0, f(a)), (0, f(b)). A negyedik szim- 
bólum a b, amely szerepel a szótárban, a következővel együtt (ba) viszont már 
nem, ezért átküldjük a (3, f(a)) párost, amelyből a 3 jelöli a b indexét, f(a) pedig 
a következő karakter, vagyis az a kódját. A ba sorozatot felvesszük a szótárba, 
indexe 4 lesz. Így folytatjuk az eljárást, az eredményt az 1.10. ábrán látható táblá- 
zatban foglaltuk össze. Látható, hogy a szótárbeli bejegyzések egyre hosszabbak, 
és ha a bemeneti sorozat ismétlődik, akkor előbb-utóbb az egész sztring szerepelni 
fog a szótárban. 


Megmutatható, hogy az LZ78 egy betűre jutó átlagos kódszóhossza konvergál 
HC) 
logs 





-hez minden stacionárius és ergodikus forrásra. 
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Az LZ78 algoritmus egyik hibája, hogy a szótár folyamatosan, korlát nélkül 
növekszik. A gyakorlatban egy bizonyos határon túl gátat szabunk a növekedés- 
nek: vagy rendszeresen eltávolítjuk a felesleges vagy ritkán használt bejegyzése- 
ket, vagy egy idő után fix szótárasként működik tovább az eljárás. 


Az LZW algoritmus 


Terry Welch az LZ78 módosításával egy olyan technikát dolgozott ki, amellyel 
megtakarítható az (i, c) párból a c karakterkód átküldése. Ez az ún. LZW algorit- 
mus. A kódoló tehát csak szótárbeli indexeket küld át. Ehhez szükséges, hogy a 
szótárban már a kiinduló állapotban is szerepeljen az összes egybetűs szimbólum 
a forrásszimbólumokat a p pufferbe, amíg a sorozat szerepel a szótárban. Ha az a 
karakter az első olyan, amelyre pa nincs benne a szótárban (az egymás után írás- 
sal a konkatenációt jelöltük), akkor átküldjük a p sorozat indexét, a pa sorozatot 
felvesszük a szótárba és az a karaktertől kezdve folytatjuk az eljárást. 
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1.12. példa. Kódoljuk az LZW algoritmussal az előző sorozatunkat: 
dabbacdabbacdabbacdabbacdeecdeecdee 


A forrásábécé X — (a, b, c, d, e), kezdetben ez az 5 bejegyzés szerepel a szótárban. 
A kódoló először veszi a d karaktert. Ez benne van a szótárban, így hozzáilleszti 
a következő, az a karaktert. A da sorozat már nem szerepel a szótárban, ezért 
átküldi a d indexét, vagyis a 4-et, felveszi a szótárba a da sorozatot a 6. helyre, és 
megy tovább az a-val kezdve. Az a szerepel a szótárban, így hozzáveszi a b-t. ab 
nincs bent, tehát átküldi a indexét, a 2-t, felveszi ab-t, és folytatja az eljárást b-től, 
stb. Az 1.11. ábrán látható táblázat tartalmazza a kódolás végeztével a szótárban 
található indexeket és karaktersorozatokat. A kódoló kimenete a következő: 


4,1,2,2,1,3,6,8,10,12,9,11,7,16,4,5,5,11,21,23,5 


1.13. példa. Dekódoljuk az LZW algoritmussal tömörített, A — (a,b) forrás- 
ábécé feletti abababab . . . karaktersorozatot. A kódoló kimenetéről a dekódoló 
bemenetére az 1,2,3,5,4,7,6,9,8,... sorozat jut el. A kiindulási szótár tartal- 
mazza az a és a b bejegyzést. Így az 1,2 sorozatot dekódoljuk a illetve b ka- 
rakterként. A szótárba felvesszük az ab bejegyzést harmadiknak, és a következő 
sorozat, amely a szótárba kerül majd, a b karakterrel fog kezdődni. A 3 kódszó 
érkezik a bemeneten, ezt dekódoljuk ab-ként. Először az a betűt illesztjük a ké- 


244 


szülő új szótárbejegyzés kezdő b betűjéhez. Mivel a ba sorozat nincs a szótárban, 
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index bejegyzés index bejegyzés 
1 a 14 acd 
2 15 dabb 
3 fő 16 bac 
4 d 17 cda 
5 e 18 abb 
6 da 19 bacd 
7 ab 20 de 
8 bb 21 ee 
9 ba 22 ec 
10 ac 23 cde 
11 cd 24 eec 
12 dab 25 cdee 
13 bba 


1.11. ábra. Az 1.12. példa szótára. 


felvesszük azt. A következő új bejegyzés a betűvel fog kezdődni. Mivel az ab 
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párnak csak a kezdő a betűjét használtuk fel, a maradék b betűt hozzáillesztjük a 
készülő új szótárbejegyzéshez, így ab-t kapunk. Ez már szerepel a szótárban, ezért 
tovább folytatjuk a dekódolást. Az első 4 bejegyzés készen van, míg az 5. éppen 
készülőfélben, a következő bemenet pedig az 5 kódszó, amely a még nem teljesen 
kész bejegyzésre hivatkozik. Ennek ellenére tovább tudjuk folytatni a dekódolást! 
Ha ismernénk az 5. bejegyzést, annak első két karaktere ab lenne. Illesszük az a 
karaktert a készülőben lévő új bejegyzéshez. Mivel az így kapott aba még nem 
szerepel a szótárban, ez lesz az 5. bejegyzés. A következő bejegyzés a betűvel fog 


kezdődni, és még megmaradt a ba sorozat az előző dekódolásból, stb. Az alábbi 
táblázat tartalmazza a kódoló és a dekódoló által épített szótárt: 








index bejegyzés index bejegyzés 
1 a 6 abab 
2 b 7 bab 
3 ab 8 baba 
4 ba 9 ababa 
5 aba ; 


A Unix COMPRESS parancsa és a GIF (Graphics Interchange Format) képtö- 
mörítő eljárás is az LZW algoritmust használja, mégpedig adaptív szótármérettel. 
A COMPRESS esetében kezdetben a szótárban 512 bejegyzésnek van hely, ez azt 
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jelenti, hogy a kódszavak 9 bit hosszúak. Amikor a szótár betelik, méretét meg- 
duplázzuk, 1024 bejegyzésre. Ettől kezdve 10 bites kódszavakat viszünk át, és 
így tovább. A kódszavak lehetséges maximális hosszát a felhasználó állíthatja be 
9 és 16 bit között (alapértelmezés: 16 bit). Ezt elérve, a COMPRESS eljárás stati- 
kus szótár alapú technikává válik. Ilyenkor a program figyeli a tömörítési arányt. 
Amennyiben ez egy bizonyos küszöb alá esik, a szótár már nem felel meg célja- 
inknak, ezért a szótárépítő folyamat kezdődik elölről. Így a szótár mindig tükrözi 
a forrás lokális jellemzőit. 

Szintén az LZW algoritmusra épül a CCITT (ma: ITU-T) V.42bis tömörí- 
tési szabványa, amely a telefonhálózaton modemekkel történő adatátvitelről szóló 
V.42 ajánlás kiegészítése. Az algoritmus két üzemmódot definiál. Az egyik a 
transzparens mód, amikor az adatok tömörítetlen formában kerülnek átvitelre, a 
másik pedig a tömörített mód. A két üzemmódra azért van szükség, mert lehetsé- 
ges, hogy az átvitelre kerülő adatokban nincs redundancia, ezért nem tömöríthető 
az LZW algoritmussal. Ebben az esetben a tömörítő eljárás még hosszabb ki- 
menetet eredményezne, mint a bemenet (ez a helyzet például, ha egy előzőleg 
már tömörített fájlt akarunk átvinni a telefonvonalon). Tömörített üzemmódban 
a rendszer LZW algoritmust használ változó méretű szótárral. A szótár kezdeti 
méretét a kapcsolat létrejöttekor egyezteti az adó- és a vevőberendezés. A V.42bis 
ajánlás minimum 512 bejegyzés méretű szótárat tartalmaz, de 2048 méretűt tart 
ideálisnak. Az összes bejegyzés nem használható fel szabadon, mert van 3 ki- 
tüntetett szerepű kódszó. Ezek illetve jelentésük a következő: Enter Transparent 
Mode (üzemmódváltás: ettől kezdve a transzparens mód érvényes), Flush Data (a 
szótárépítést előről kezdjük), Increment Codeword Size (megduplázzuk a szótár 
méretét, s ezzel együtt eggyel növeljük a kódszavak méretét is). Az adatátvitel 
során bekövetkező hibák hatásának csökkentésére az ajánlás meghatározza a ma- 
ximális sztringméretet, amely szerepelhet a szótárban. Ezt 6 és 250 között az adó- 
és a vevőberendezés határozza meg a kapcsolat felépítésekor (alapértelmezés: 6). 


1.9. Feladatok 


1.1. feladat (Egyértelmű dekódolhatóság alternatív definíciója). Nevezzünk 
egy f : X — y" kódot egyértelműen dekódolhatónak, ha az u — uj : - - u és v — 
V1"" "Vr üzenetekre (itt 41, V1, . . . , uk, Vk E X) 


fin)f(u): f(ux) — fv) f(wv2) f(x) 


esetén u; — v; minden i-re. Tehát az 1.1. definícióval ellentétben csak azt kö- 
veteljük meg, hogy bármely két különböző, azonos hosszúságú üzenet kódja is 
különbözzön. Bizonyítsa be, hogy a két definíció ekvivalens! 
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1.2. feladat (Az optimális kód átlagos szóhossza). Mutassa meg, hogy az opti- 
mális bináris kód átlagos kódszóhossza tetszőlegesen közel lehet H(X ) -- 1-hez. 
Pontosabban, bármely kis € 5 0 számhoz adjon meg egy olyan eloszlást az X 
forrásábécén, hogy az optimális bináris kód átlagos kódszóhosszára 


ELfOOI5 H(X)41—e 
teljesüljön. 


1.3. feladat (Egyenlőség a Kraft-egyenlőtlenségben). Nevezzünk egy f prefix 
kódot teljesnek, ha bármely új kódszó hozzáadásával a kód elveszti prefix tulaj- 
donságát. Egy x sztringet dekódolhatatlannak nevezünk, ha nem lehet kódszavak 
egymás után írásával olyan sztringet kapni, amelynek x a prefixe. Mutassa meg, 
hogy a következő három állítás ekvivalens: 


a) f teljes, 


b) nem létezik f-re nézve dekódolhatatlan sztring, 


n 
e: s7Ii — 1, ahol s a kódábécé elemszáma, Il; az i-edik kódszó hossza, és n a 
i—1 
kódszavak száma. 


1.4. feladat (Rossz kódok). A következő bináris kódok melyike nem lehet sem- 
milyen eloszlás Huffmann-kódja? Mindegyik válaszát indokolja meg, azaz ha 
nincs ilyen eloszlás, akkor magyarázza meg miért, ha pedig van, akkor adjon meg 
egy olyat! 


a) 0,10,111,101 
b) 00,010,011,10,110 
c) 1,000,001,010,011 


1.5. feladat. Legyen az X — (x1, . . . , xn ) forrásábécén adott valószínűség-eloszlás 
olyan, hogy minden egyes elem valószínűsége 27" alakú, ahol i egy pozitív egész 
szám. Bizonyítsa be, hogy ilyen esetekben a bináris Shannon-Fano-kód optimá- 
lis! Mutassa meg, hogy a bináris Huffman-kód átlagos kódszóhossza akkor és 


csak akkor egyezik meg az entrópiával, ha az eloszlás ilyen alakú! 


1.6. feladat. Legyen az X forrásábécé ötelemű, a következő valószínűségekkel: 
0.4; 0.35;0.1;0.1;0.05. Mennyi az eloszlás entrópiája? Konstruálja meg a bináris 
Shannon-Fano-kódot erre az eloszlásra, illetve konstruáljon bináris prefix kódot 
az I; — (—logp(x;) ] kódszóhosszakkal az 1.2. lemma bizonyítása szerint (a kód 
bináris fával való reprezentálásával). Mennyi az átlagos kódszóhossz? 
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1.7. feladat. Egy pénzérmét addig dobunk fel, amíg írást nem kapunk. Jelölje az 
X valószínűségi változó a dobások számát. Mennyi az X entrópiája? 


1.8. feladat (Egyenletesebb eloszlás entrópiája nagyobb). Mutassa meg, hogy 
a 


(D1,.-.5 Dis:..,Dj:.Pn) 


eloszlás entrópiája nem lehet nagyobb, mint a 


lopas ret Pn) 





eloszlás entrópiája! 


1.9. feladat (Egyenletesebb eloszlás optimális kódja rosszabb). 
Tekintsük a 

p — (D1-.., Dix..5Dj Pn) 
illetve 


Dit Dj DiTt Dj 
9a— (Di... 3) Ede 2 1... Pn) 





eloszlásokat. Mutassa meg, hogy a g eloszláshoz tartozó optimális (minimális át- 
lagos kódszóhosszúságú) kód átlagos kódszóhossza (ga szerint) nem lehet kisebb, 
mint a p eloszláshoz tartozó optimális kód átlagos kódszóhossza (p szerint) ! 


1.10. feladat (Információs divergencia). — Legyen p — (p1i,..., Pn) és g — 
(di, :..,4n) két valószínűség eloszlás, és definiáljuk a két eloszlás közötti ,in- 
formációs távolságot" a 


n 
Di 
D(pla)— ) pilog— 
i—1 di 
kifejezéssel. (A mennyiséget gyakran információs divergenciának, relatív ent- 


rópiának, vagy Kullback-Leibler-távolságnak nevezik.) Lássuk be a következő 
tulajdonságokat: 


e Bármely két eloszlásra D(p I a) 2 0, és egyenlőség pontosan akkor teljesül, 
ha p — a. 
e H(p) —1ogn— D(p I u), ahol H(p) jelöli a p eloszlás entrópiáját, u pedig 


az egyenletes eloszlást az (1, . . . n ) halmazon. 


1.11. feladat (Rosszul ismert eloszlás). Tegyük fel, hogy az X valószínűségi vál- 
tozó eloszlása p — (pi, . . . , PDn). de ez az eloszlás nem pontosan ismert, helyette 
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ag — (gi, . . . , n) eloszlás adott, és ennek ismeretében készítünk Shannon-Fano- 
kódot, melynek kódszóhosszúságai tehát /; — og zt i— l,...,n. Mutassa meg, 
hogy a kapott kód átlagos kódszóhosszára 


n 


H(p)3D(pla) c 27 il; c H(p) tD(pla) 4-1 


teljesül! Ez azt jelenti, hogy az ár, amelyet az eloszlás pontatlan ismeretéért fize- 
tünk, körülbelül az információs divergenciával egyezik meg (ami sohasem lehet 
negatív, tehát semmiképpen sem nyerhetünk!). 


1.12. feladat (Shannon-Fano- és Huffman-kód). Legyen az X valószínűségi 
változó eloszlása (3 25 2; 5) Konstruáljon Huffmann-kódot ehhez az elosz- 
láshoz. Mutassa meg, hogy két különböző optimális kód is van, azaz, hogy az 
(1;2;3;3), és a (2;2;2:2) kódszóhosszúságokkal adott mindkét kód optimális. 
Vonja le a következtetést, hogy létezik olyan optimális kód, amelynek van a meg- 
felelő Shannon-Fano-kódénál hosszabb kódszava is. 


1.13. feladat (Huffmann-kód kódszóhosszai). Tegyük fel, hogy a (pi, ...,DPn) 
eloszláshoz készítünk optimális bináris prefix kódot, ahol pi 5 p2 5": "5 Pn 5 0. 
Bizonyítsa be, hogy 


e Hapi- 5 akkor a hozzá tartozó kódszó egy hosszúságú; 


e Hap c 2 akkor a hozzá tartozó kódszó legalább kettő hosszúságú. 


1.14. feladat (Titkosítás). Legyenek X és Z bináris (0-1 értékű) független való- 
színűségi változók, úgy, hogy PfX—1)— pés P(Z—1)— 5. LegyenY —XeZ, 
ahol € modulo 2 összeadást jelöl. X felfogható, mint titkosítandó üzenet, Z a tit- 
kos kulcs, és Y a rejtjelezett üzenet. Számolja ki a következő mennyiségeket, 
és magyarázza meg jelentésüket a titkosítás szempontjából: H(X), H(X IZ), 
H(X I1Y), H(X IY,2). 


1.15. feladat (Egyenlőtlenségek). Legyenek X,Y és Z tetszőleges (véges érték- 
készletű) valószínűségi változók. Bizonyítsa be a következő egyenlőtlenségeket: 
e H(X,YIZ) 2 H(X IZ), 
e H(X,Y,72)—H(X,Y) S H(X,2)—H(X). 
1.16. feladat. Legyen X — XI, X2,... egy bináris, emlékezetnélküli stacionárius 


forrás, amelyre PfXji —1)— 1079. Adjuk meg az X egy olyan változó szóhosz- 
szúságú blokk-kódját, melynek betűnkénti átlagos kódszóhossza kisebb, mint 1 
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1.17. feladat (Futamhossz kódolás). Legyenek X; , . . . , X, bináris valószínűségi 
változók. Jelölje R — (R1,R2,...) az egyes szimbólumok előfordulásainak fu- 
tamhosszait. Tehát például az 1110010001111 sorozathoz R — (3,2,1,3,4) tarto- 
zik. Hogyan viszonyul egymáshoz H(X1 , . . . ,X Xn), H(R) és H(R,X,.)? 


1.18. feladat (Markov-lánc entrópiája). Legyen X — XI , X2 , . . . egy bináris, sta- 
cionárius Markov-lánc, amelynek állapotátmenetei a következők: 


























P(X2—0]XI— 0) D, 
P(X 1 XI 0) 1— p, 
TT 
P(X—OIXI—1) sal 
1 
P(Xx2—1]XI—13) Pp 





Mennyi P(Xi — 0)? Mennyi a forrás entrópiája? 


1.19. feladat (Bináris entrópiafüggvény tulajdonságai). Legyen a [0,1] inter- 
vallumon értelmezett Ah függvény (bináris entrópiafüggvény) értéke 


h(x) -— —x1ogx—(1—x)log(1—x), 


ha x € (0,1), és h(0) — h(1) — 0. Mutassuk meg, hogy h rendelkezik a következő 
tulajdonságokkal: 


e szimmetrikus az 5 pontra; 
e [(0,1] minden pontjában folytonos; 
. 10, 5] -ben szigorúan monoton növekvő; 


e szigorúan konkáv. 


1.20. feladat (Vissza a jövőbe). Legyen ...,X 2,X 1, Xo,X1.,X2,... valószínű- 
ségi változók egy stacionárius sorozata. Mutassa meg, hogy 


H(Xo I X.1,X.2,....X-n) — H(Xo I X1..X2., . ...Xn) 
azaz, a jelen feltételes entrópiája a múlttal és jövővel mint feltétellel megegyezik. 


1.21. feladat. Legyenek a Z stacionárius Markov-lánc állapotai a 0, l, . . . , 255 
számok, és tegyük fel, hogy az állapotátmenet valószínűségek az alábbi 256 x 
256-os mátrixszal adottak (a mátrix i-edik sorának j-edik oszlopában a PfZ2 — j] 
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Z1 — i) valószínűség található). Mi a Markov-lánc stacionárius eloszlása? Meny- 
nyi a forrás entrópiája? Készítsen jó, egyértelműen dekódolható, változó szóhosz- 
szúságú blokk-kódot! 


1/2 1/4 14 0 0 0 -.. 0 
0  1/2 1/4 1/4 0 0 -.. 0 
0 


0 0 1/2 1/4 1/4 0 
0 0 -.. 0 1/2 1/4 1/4 
1/4 0 0 -.. 0 1/2 1/4 
1/4 1/4 0 --. 0 0 1/2 


1.22. feladat. Az alábbi ábra egy Z — Z1, 22 , . . . Markov-lánc működését írja le. 
Tegyük fel, hogy a láncot a stacionárius eloszlásból indítjuk. 


1—p 


(CS TD ee 


(1— p)/2 


Legyen továbbá Y/ , Y2 , . . . független, azonos eloszlású bináris valószínűségi vál- 
tozók sorozata, ahol P(Y; — 0) — 3 Definiáljuk az X — XI, X2,... forrást az 
X; — 22; 1- Y; egyenlettel. Mennyi az X forrás entrópiája, feltéve, hogy Z1 , 22 , . . . 


független NY! , Y2 , . . .-től? 


1.23. feladat (Lempel-Ziv). Adjuk meg a 36 darab nullából álló sztring LZ78- 
kódját! 
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2. fejezet 


Forráskódolás 
hűségkritériummal 


Az eddigi vizsgálataink során megköveteltük, hogy a kódolt üzenet egyértelműen 
visszaállítható legyen. Ezt a követelményt sok gyakorlati probléma esetén fel kell 
adnunk, illetve jobb, ha feladjuk. Ebben a fejezetben olyan forráskódolási eljárá- 
sokat vizsgálunk, ahol az üzenet tökéletes reprodukciója helyett csak azt várjuk el, 
hogy a dekódolt üzenet az eredetit valamilyen értelemben hűen — de nem feltétle- 
nül pontosan — adja vissza. Ilyen típusú kódolásokkal a hírközlés gyakorlatában 
sokszor találkozhatunk. Az emberi beszéd digitális átvitele illetve tárolása ese- 
tében például a folytonos jelből mintavételezéssel és kvantálással olyan jelet ka- 
punk, amely már véges értékkészletű. Mégis azt mondhatjuk, hogy ezzel semmit 
sem vesztettünk, hiszen például a digitális központon keresztülhaladó telefonkap- 
csolat ugyanolyan jó minőségű (vagy jobb), mintha az analóg/digitális — digitá- 
lis/analóg átalakítást elhagynánk. A lényeg az, hogy a forrásnak csak számunkra 
lényeges jellemzőit tartjuk meg, és így — megelégedve a közelítő visszaállítással 
— úgy kódolhatjuk, hogy a kapott jel továbbítása illetve tárolása már kisebb költ- 
séggel megoldható. (Vagyis pl. bináris kódot használva, a forrás kevesebb biten 
reprezentálható.) 





A következőkben tárgyalandó kódok közös jellemzője lesz, hogy ún. blokkból- 
blokkba kódok, azaz a forrásábécé betűinek állandó hosszú blokkjait állandó hosz- 
szú kódszavakkal kódoljuk. Feltesszük, hogy adott az üzenetek és a kódjaik között 
egy ún. hűségmérték, ami azt méri, hogy egy adott kódszót milyen mértékben te- 
kinthetünk egy adott üzenet reprodukciójának. Vizsgálataink középpontjában az a 
kérdés áll, hogy kódolással milyen mértékben tömöríthetjük a forrás által kibocsá- 
tott jelet, ha azt akarjuk, hogy a kód a forrást adott átlagos hűséggel reprezentálja. 


Sajnos torzítást megengedő forráskódolás esetén a tömöríthetőség elvi hatá- 
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rainak a jellemzése általában nem konstruktív, ugyanakkor a gyakorlati felada- 
tokban mégis kell tömöríteni, tehát megemlítünk néhány gyakorlati eljárást is: 
kvantálást, mintavételezést, prediktív kódolást, beszéd-, hang-, kép- és videotö- 
mörítést. A fejezetet az elvi határok tisztázásával zárjuk. 


499 


2.1.  Forráskódolás előírt hibavalószínűséggel 


A változó szóhosszú forráskódolás egy hátránya azonnal szembetűnik: egy kód- 
szó meghibásodása esetén előfordulhat, hogy az utána levő összes kódszó dekó- 
dolását elrontjuk, mivel a kezdetüket rosszul detektáljuk. Ha állandó hosszúságú 
kódszavakat használunk, akkor ez nem fordulhat elő; bármely kódszó meghibáso- 
dása csak az illető kódszó dekódolásánál okoz gondot, hiszen a kódszó kezdetek 
kijelölése még dekódolás előtt megtörténhet. Azonban — mint rögtön látni fogjuk 
—, ez a megoldás elveszi a tömörítés lehetőségét. Legyen ugyanis X az n-elemű 
m-hosszú kódszavakba képez le (tehát f : X" — y"), akkor az egyértelmű dekó- 
dolhatóság feltétele az 

n" as" (2.1) 
egyenlőtlenség teljesülése, vagyis ezt a betűnkénti átlagos kódszóhosszal kife- 


jezve 


L m. logn 





— — sZ eli 
k " logs7 6 


mivel a különböző k-hosszú üzeneteknek különböző m-hosszú kódszavakat kell 
megfeleltetni. A (2.2) feltétel természetesen elégséges is egyértelműen dekódol- 
ható f : X" —; Yy" kód létezésére. Mivel a forrás entrópiája jóval kisebb lehet 
logn-nél (de legfeljebb ennyi) ezért (2.2) megmutatja, hogy az állandó szóhosszú 
egyértelműen dekódolható kódok esetében az átlagos kódszóhossz általában nem 
közelítheti tetszőlegesen a forrásentrópiát bármilyen nagy legyen is a k blokk- 
hossz. Valójában csak akkor nem vesztünk semmit, ha a kódolt forrás emlékezet- 
nélküli és stacionárius egyenletes eloszlással. 

Feladjuk tehát az egyértelmű dekódolhatóságot, és helyette azt követeljük 
meg, hogy a k hosszú üzeneteket nagy valószínűséggel tudjuk dekódolni. Mie- 
lőtt továbbmennénk bevezetünk egy jelölést: 

Ha adott az X — XI , X2 , . . . stacionárius forrás, akkor a k hosszú üzenetek B C 
XX" halmazának valószínűségén a következőt értjük: 


P(B) — P((X,....Xx) EBhb. 
A stacionaritás miatt persze bármely k-hosszú blokkot vehetnénk: 


P(B) — P((Xn,...,Xnx) EB), n—-1,2,... 


2.1. HFORRÁSKÓDOLÁS ELŐÍRT HIBAVALÓSZÍNŰSÉGGEL 63 


Ha x — (xi, . . . , xx) E X", és a szokásos 
P(x) — P(XI — xi, ....Xx— xx) 


jelölést használjuk, akkor 


P(B)— ) p(. 


xeB 


2.1. definíció. Az X stacionárius forrás f : X" 5 Y" kódját akkor mondjuk €- 
hibával (0 € € € 1) dekódolhatónak, ha létezik olyan f" : y" S X" dekódoló 
függvény, hogy a hibás dekódolás valószínűsége kisebb €-nál, vagyis 


PIT (F(X, . . ,X)) 7 (XI, . § .,Xk)) S €. 
MEGJEGYZÉS: 


a) A dekódolás hibáját a következő módon írhatjuk fel: 


PIF(T(X1.... XI) A (X..... XI d 0 PG). 
x: f((x))Ax 


b) Könnyen belátható, hogy az f : X" 5 y" pontosan akkor dekódolható €- 
hibával, ha f az X" egy 1 — £-nál nagyobb valószínűségű B részhalmazát 
invertálhatóan képezi le. Ebből következik, hogy akkor és csak akkor lé- 
tezik f : Xk.; Um e€-hibával dekódolható kód, ha létezik olyan BC xk 
amelyre P(B) 51—egés [B] 5". 





Az előbbi megjegyzés szerint tehát akkor kapunk a forrás k hosszú blokkjait 
állandó szóhosszúságú, €-hibával dekódolható minimális kódszóhosszú kódot, ha 
keresünk egy minimális számosságú B c X" üzenethalmazt, amelyre P(B)51—e. 
Legyen m olyan, hogy 

s"! c ]IBI£ s", (2.3) 


és így a B-beli üzeneteket kölcsönösen egyértelműen kódolhatjuk az m hosszú 
kódszavakkal. A többi üzenetet bárhogy (például mindegyiket egyazon x € B 
kódjával) kódolva, egy f : X" — U" e-hibával dekódolható kódot kapunk ami 
persze optimális lesz, vagyis ha g : X" o y" is e-hibával dekódolható, akkor 
m Cam. 

Ilyen minimális elemszámú halmazt könnyen találhatunk. Indexeljük a k 
hosszú üzeneteket (összesen / — n" darabot) valószínűségeik szerint csökkenő sor- 
rendben: 


p(xi1) 2 p(x2) 22 p(x), 
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és legyen N(k,€) az az index, amelyre 
N(k,e) N(k,e)—1 
P(x) 51—e, de p(x;)) £1—e. 
i—1 i—1 


Ekkor nyilván az első N(k, €) üzenet, vagyis a 


N(k,e) 


Bxe— U (xx) 2.4 


i—-1 


halmaz a kívánt minimális elemszámú, mivel semmilyen N(k, £)-nál kisebb elem- 
számú halmaz nem lehet 1 — €-nál nagyobb valószínűségű. 
Ha tehát az f : X" — Y" e-hibával dekódolható kód, akkor 


N(k,e) Cs", 


tehát 





má klogN(k,€) 


LE 
k 7 logs 


(2.5) 
Az L betűnkénti kódszóhossz viselkedésére (a k blokkhossz növelésével) tehát az 
z logN (k,€) viselkedésének vizsgálatával következtethetünk. A rendkívül fontos 
és meglepő (mivel €-tól függetlenül igaz) 


1 
lim — logN(k,e) — H(X) 
koo k 


összefüggést fogjuk bebizonyítani a stacionárius források egy jelentős osztályára, 
az információstabilis forrásokra, majd ennek felhasználásával kimondjuk és bizo- 


nyítjuk az előírt hibavalószínűségű forráskódolás tételét, amely formailag nagyon 
hasonlít a változó szóhosszúságú forráskódolás 1.9. tételéhez. 


2.2. definíció. Az X — XI, X2, . . . stacionárius forrást információstabilisnak ne- 
vezzük, ha minden ő 5 0-ra 


koo 


1 
Him P ([—glogplti,...X)— HON 5 5] 7-0, 


vagyis az Y, — —i log p(X1, . . . , Xx); k— 1,2, . . . valószínűségi változók sorozata 
valószínűségben (sztochasztikusan) tart H(X)-hez, ha k — oo. 
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MEGJEGYZÉS: 


a) 


b 


bosz 


Az X információstabilitása nagyjából azt jelenti, hogy elég nagy k-ra, a k 
hosszú sorozatok 1-hez közeli valószínűségű részére, mondjuk az A c XF-ra 
igaz, hogy 


—logp(x) z H(X) 


illetve 
pg sz 


ha x € A, valamint 
Ia s 2/409, 


4 


Ezt a kijelentést később pontosítjuk majd, és látni fogjuk, hogy a kódolási 
tétel lényegében ezen az észrevételen alapul. 


Nem túl egyszerűen, de be lehet bizonyítani, hogy a stacionárius és ergodi- 
kus források információstabilisak. Azt viszont most megmutatjuk, hogy ha 
X — X1, X2, . . . emlékezetnélküli és stacionárius, akkor X információstabi- 
lis: 


Mivel XI , X2 , . . . , Xx függetlenek és azonos eloszlásúak, 


Yk 


1 
— glogp(xX.22,. . ..Xx) 7 


—7log (P(X1)P(X2) ::p(X)), 


vagyis 


Y, — 


a] 
B 


(—logp(X;)), 


i—1 


ahol a —log p(X;)-k független, azonos eloszlású valószínűségi változók. A 
nagy számok gyenge törvénye szerint ekkor az NY) , . . . , Yx, . . . sorozat való- 
színűségben konvergál az lx.-k közös várható értékéhez, H(X1) — H(X)- 
hez, tehát X információstabilis. 


242 24 


A következő tételen alapul majd az előírt hibavalószínűségű kódolás tétele: 


2.1. tétel. Ha az X stacionárius forrás információstabilis, akkor 


1 
lim — log N(k, e) — H(X) 
köss k 


minden 0 c € c 1 esetén. 
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BIZONYÍTÁS: Legyen a k pozitív egészre és ő 5 0 tetszőleges valós számra A, 5 
a következő halmaz: 


1 
487 fxext: —4logpb9 - HON 28), 
azaz X € Ax. 5 pontosan akkor, ha 
27K(HCOJ-8) z p(x) c 27HHGI- 8) , 


AZ Ax. elemeit szokás tipikus sorozatoknak hívni, mivel egyrészt a valószí- 
nűségük közelítőleg 2-/HC) , másrészt az AC kő összvalószínűsége , kicsi". 
AZ Ax,5 elemeinek számát a következőképpen becsülhetjük felülről: 


12 P(Ax3)— E P(x2 Jákó] an 4 2 [Aga 27870979) , 
XEAk,ő 


vagyis 
las] E2/A8097ő) , (2.6) 


Mivel az X információstabilitása pontosan azt jelenti, hogy P(Ax 5) — 1, hak 6 
co, minden pozitív ő esetén, ezért k elég nagy értékeire P(Az 5) 5 1 — € teljesül. 
Tudjuk viszont, hogy Bxe olyan halmaz, hogy nála kisebb elemszámú halmaz 
valószínűsége nem lehet nagyobb 1 — €-nál, tehát (2.6)-ból 


N(k,e) — IBxel £ Ax] 2 267091) 


következik, ha k elég nagy. Ebből azt kapjuk, hogy 
1 
h; logN(k, e) c H(X) 1-ő 
minden elég nagy k-ra, és mivel ő tetszőleges volt, ez azt jelenti, hogy 


1 
limsup klogN(k,e) c H(X). 2.7 


kooo 
Válasszuk most k-t olyan nagynak, hogy P (Ak, 5) - s HE teljesüljön. (Ezt meg- 
tehetjük, hiszen se a 1.) Ekkor, mivel P Úr e) a € (B" a B halmaz komplemen- 
tere, vagyis B" — yt 1.8), ezért 


17-e 
2 


N 


P (A45) — 
S B (Akő A Br) xP (Akő A Br e) 2Z 
Za P(An5NBre) e, 
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és innen 
1—e 
P (Akő NBre) pa HÉ 


írhatjuk tehát, hogy 


1—e 
ge 38 P(Ax5NBxe) S 
LL IA 50 Bkeel : max p(x) c 
5 7 XEAk ő 
7 [ge ez őő, 


vagyis 


1—€E)  -k(r009-5) 
Ne) 2 ( 3 ) 2 é 


Ezt átrendezve azt kapjuk, hogy 





1 1 1 — 
glogN(k,e) 2 H(X) 87 moz ( 7) 


ha k elég nagy. Mivel ő - 0 tetszőleges volt, ebből következik, hogy 
szg taal 
liminf — logN(k,e) 2 H(X), 
kaco k 
amiből (2.7)-tel együtt következik a tétel állítása. HI 
Most már mindent tudunk az €-hibavalószínűségű kódolás tételéhez. 


2.2. tétel. Legyen az X stacionárius forrás információstabilis. Ekkor, ha az X 
forrás k-hosszú blokkjait €-hibával (0 € € € 1) kódoljuk állandó my hosszú kód- 
szavakkal, akkor kódok bármely ilyen tulajdonságú sorozatára 





hide Ek 
kosok logs 


Másrészt, tetszőleges 0 a e a 1 hibavalószínűséghez és pozitív 8-hoz elég nagy k 
esetén mindig létezik olyan f : X 5 yU"r e-hibával dekódolható kód, hogy 


mg H(X) 


TE 
k logs 


48. 





68 2. HFORRÁSKÓDOLÁS HŰSÉGKRITÉRIUMMAL 


BIZONYÍTÁS: Ha f:X"-—5 yrr €-hibával dekódolható kód, akkor (2.5) szerint 


Mk z logN(k, €) 
k 7 logs 





, 


és itt a jobb oldal az előző tétel szerint 9 hez tart k — oo esetén, tehát az első 


log 
állítást beláttuk. 
A második állítás bizonyításához legyen 


. [logN(k,e) 
Mk — ee] , (2.8) 


ahol az [x] jelölés az x valós szám felső egész részét jelenti. Ekkor a 2.1. tétel 
miatt létezik olyan ko, hogy 


2 1 Öö 
kos 5 és klogN(k,e) a H(X) 2 logs, ha k5 ko. (2.9) 


Ekkor (2.8) és (2.9) szerint 








my 1 flogN(k,e) H(X) 8 1 H(X) 
ZZ 1 fő) 
k c 7( logs jibyé éa logs Tzbg logs jú 
ha k 5 ko, amivel a második állítást is bebizonyítottuk. HI 


A 2.2. tétel tulajdonképpen azt mondja ki, hogy nem lehetséges tetszőlegesen 
nagy blokkokat kódoló €-hibával dekódolható olyan kódot konstruálni, melynek 
betűnkénti átlagos kódszóhossza kisebb kes -nél, de ezt az értéket felülről tetsző- 
legesen megközelíthetjük, ha elég nagy blokkhosszt (4) használunk. 

Vizsgáljuk most a problémát más szempontból. Kérdezhetjük azt, hogy ha a 
betűnkénti átlagos kódszóhosszat állandó értéken tartjuk, mi történik a dekódolás 


hibájával a k blokkhossz növelésével. Vezessük be az 





m 
R — 5 logs 
jelsebességet, ami megadja, hogy ha az N — 5" darab kódszót binárisan reprezen- 
táljuk, akkor forrásbetűnként átlagosan hány bitet használunk fel. Mivel az m- 
hosszú kódszavakkal N — 5" kódszót lehet egyértelműen dekódolhatóan kódolni, 
ezért az R jelsebességű, k-hosszú blokkokat kódoló kódok közül az a legjobb (leg- 
kisebb hibával dekódolható), amelyik az X" első N — 2 legnagyobb valószínű- 
ségű elemét kódolja egyértelműen (a többi üzenetet tetszőlegesen). Tehát ha az 
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X elemei valószínűségeik szerint csökkenő sorrendben vannak indexelve, akkor 
a legjobb ilyen kód hibavalószínűségére 


P.(k.R)— Y P(x) (2.10) 


iz2kR 
adódik. 


2.3. tétel. Ha az X stacionárius forrás információstabilis, akkor a legfeljebb R 
jelsebességű, k hosszú blokkokat állandó szóhosszon kódoló, legkisebb hibával 
dekódolható kód hibavalószínűségére igaz a következő: 


lim Pe(k,R)— 0, haR 5 H(X), 
00 


lim Pe(k,R)— 1,  haR c H(X), 
00 


vagyis R 5 H(X) esetén elég hosszú blokkokat kódolva a dekódolás hibája tetsző- 
legesen kicsivé tehető, míg R c H(X) esetén a blokkhosszt növelve a dekódolás 
hibája 1-hez tart, azaz a kód használhatatlanná válik. 

BIZONYÍTÁS: Legyen R, — Sélogs az f : XF. , y"k minimális betűnkénti átla- 
gos kódszóhosszú, €-hibával dekódolható kód jelsebessége, és legyen R 5 H(X). 
A 2.2. tétel második fele szerint 


limsup Rk £ H(X). 
koco 
Mivel R 5 H(X), ezért létezik olyan (e-tól függő) ko index, hogy Rx € R, ha 
k 5 ko. Ebből (2.10) szerint 


Pe(k,Rx) 2 Pe(k,R) 


következik, vagyis 
P.(k,R) c e, 


ha k 5 ko, és mivel e tetszőlegesen kicsi lehet, a tétel első felét beláttuk. 

Legyen most R c H(X). Tegyük fel, hogy a tétel második állítása nem tel- 
jesül. Ekkor létezik egy olyan k; — co sorozat, hogy Pe(ki,R) c e (i— 1,2,...) 
valamilyen € c 1 pozitív számra. Egy ilyen R jelsebességű, k;-hosszú blokkokat 
kódoló kód átlagos kódszóhossza persze 
— Ma R 


Tesz 
ki; 7" logs7 
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tehát j8 feTeő 
liminféti e 1861 
incs  k; " logs — logs 





ami ellentmond a 2.2. tétel első állításának, mivel ezek a kódok €-hibával dekó- 
dolhatóak. H 


Ha X emlékezetnélküli és stacionárius, akkor a Pe(k,R) hibavalószínűségre 
a 2.3. tételnél erősebb állítást is be lehet bizonyítani. Nevezetesen azt, hogy ha 
R 5 H(X), akkor Pe(k, R) exponenciálisan tart 0-hoz; és R c H(X) esetén pedig 
1 — P.(k,R) tart exponenciálisan a 0-hoz, ha k — oo. 


2.2. Kwvantálás 


A digitális módszereket a hírközlés szinte minden területén alkalmazzák. Min- 
den esetben, amikor az adatok feldolgozása digitálisan történik, a folytonos ér- 
tékkészletű jelet véges értékkészletűvé kell alakítani. A digitalizálás elvi határait 
az utolsó szakaszban tisztázzuk, de az egyértelmű, illetve az €-hibavalószínűségű 
dekódolhatósággal ellentétben az elmélet nem konstruktív. Az alkalmazott, tehát 
konstruktív digitalizálás legegyszerűbb módja a skalár (egydimenziós) kvantálás. 

Legyen X — XI, X2, . .. egy stacionárius forrás, ahol az X;-k valós valószínű- 
ségi változók. Az X egydimenziós kvantáltján egy véges értékkészletű O : RG R 
leképezéssel kapott 0(X1 ) , 0(X ), : . . diszkrét valószínűségi változósorozatot (for- 
rást) értünk. A 0(-) függvényt kvantálónak nevezzük. Vegyük észre, hogy a 
kvantálás az előző fejezet értelmében egy k — 1 hosszú blokkokat kódoló forrás- 
kód (azaz betűnkénti kód), melynek reprodukciós ábécéje a forrásábécé (a valós 
számok) egy véges részhalmaza. Természetesen az a célunk, hogy az X-et hűen 
reprezentáljuk. A kódolás hűségét egy speciális hűségmértékkel, a D(0) négyze- 
tes torzítással mérjük n hosszú blokkokra: 


D(2) — E P (Xi ony) , 


ami, mivel X;-k azonos eloszlásúak, egyenlő a következővel: 


D(9)—E((X—0(x))") 211) 


ahol X ugyanolyan eloszlású mint az X;-k. (Természetesen más hűségmértéket is 
választhattunk volna, de a gyakorlatban ez a legelterjedtebb.) 

Legyen a 0 kvantáló értékkészlete az fx1,x2, . . . ,xw) halmaz, ahol az x;-k 
valós számok. Az x; számokat kvantálási szinteknek nevezzük. Vegyük észre, 
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hogy 0-t egyértelműen leírják az (x1,x2, . . . xwt kvantálási szintek és a B; — 
(xeR: 0(x) —x;), i—1,...,N kvantálási tartományok. A B; halmazok persze 
diszjunktak és egyesítésük kiadja az egész valós egyenest. A kvantáló működése 
ezért a következőképp írható le: 


9(x)—x;, haxeB;. 


Tegyük most fel, hogy a kvantálót leíró adatok közül most csak az (xi, Xx2 , . . . xv b 
kvantálási szinteket ismerjük. Ekkor az ilyen kvantálási szinteket használó kvan- 
tálók közül a legkisebb torzítású az a 0 kvantáló, amelyre 


B; — (f(x: 1— xi S lx—xjl, J— 1,2,.... Nt (2.12) 


(legközelebbi szomszéd feltétel), ahol a döntési szabályt úgy tehetjük egyértel- 
művé (vagyis a B;-ket diszjunktakká), hogy ha egy adott x kettő vagy több B;-be 
tartozna, akkor a legkisebb indexűhöz soroljuk. Az adott kvantálási szintekkel 0 
valóban legkisebb négyzetes torzítású, hiszen ha 0" egy másik kvantáló ugyane- 
zen kvantálási szintekkel, akkor egy tetszőleges x-re 0(x) — x; (tehát x c B;) és 
9"(x) — xj valamely 1 Ci, j £ N indexekre, de ekkor (2.12) szerint 


e—xil 2 —xw]l, 


tehát 
(OKT EKE 


teljesül minden x € IR-re amiből D(0) £ D(0") következik. Ezért a következők- 
ben csak a (2.12) szerinti kvantálókkal foglalkozunk. Az ilyen kvantálók B; kvan- 
tálási tartományai nagyon egyszerűen néznek ki. Az általánosság megszorítása 
nélkül tegyük fel most, hogy a kvantálási szintek nagyság szerint rendezve van- 
nak, vagyis xy Ca x2 2 : : " a xy. Ekkor, bevezetve az y; — a ,  zelj ÉBE, ós! 
jelölést, a (2.12) szerinti B; halmazok a következő intervallumok lesznek: 


Bi — (—os,y1] B; — (9-1, yi], i—-2,... N—l, Bu — (YyN-1, 99). 


Egy ilyen, N — 5 szintű kvantálót ábrázol a 2.1. ábra. 
Az optimális kvantálási szint egy adott tartományhoz annak súlypontja. Ugyan- 
is a Steiner-tétel miatt tetszőleges c konstansra 


E((X—cY? IX e B;) — 


-E((x-EK I 8)? IX EB) (EGK B)— 0), 
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2.1. ábra. Kvantáló N — 5 kvantálási szinttel. 


tehát az 





1 
(x— xi) fd)dx—E((X— xi)? IX e B;) 
Tros/ 


akkor minimális, ha 


ami a súlypont. 
A technikai nehézségek elkerülése végett a további vizsgálataink során feltesz- 
szük, hogy a kvantált X valós valószínűségi változó eloszlása abszolút folytonos f 


sűrűségfüggvénnyel, valamint azt is feltesszük, hogy f a [—A, A] intervallumban 
folytonos, a [—A, A] intervallumon kívül nulla értékű függvény. Az f-et felhasz- 
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nálva a kvantáló négyzetes torzítása a következőképp írható fel: 


00 


N 
DV- f 6—OYZTeJar 6-0) dr 
1 B; 


—oo 


A legegyszerűbb kvantáló az egyenletes kvantáló. A Ow N-szintű egyenletes 
kvantálót úgy kapjuk, hogy az X lehetséges értékeinek halmazát, a [—A, A] inter- 
vallumot, N egyenlő nagyságú intervallumra osztjuk (ezek a B; intervallumok), és 
a kvantálási szinteket ezen intervallumok közepén helyezzük el. Formálisan tehát 


ör -A-r(21—1)Ts 


ha 
A A 
7A42G—D gy SXS-AF2 i—1,...,N. 


2Z 42 


A következő tétel megmutatja, hogy az N szintű egyenletes kvantáló négyzetes 


úg é gé aha ság 2 
torzítása nagy N esetén közelítőleg 7 (6) . 


peda 


2.4. tétel. Ha az X valószínűségi változó f sűrűségfüggvényére a fenti feltételek 
teljesülnek, akkor az X-et egyenletesen N szinten kvantáló Ow kvantáló torzítására 


a 
NV 1 
li —]D —- — 
Nee G) (95) — 12 
aszimptotikus összefüggés teljesül. 


Mivel az N-szintű egyenletes kvantálásnál egy 2A hosszú intervallumot osz- 
tottunk N egyenlő részre, egy kvantálási intervallum hossza gy — 56. A tétel tehát 


azt állítja, hogy nagy N-ekre D(OwN) 5 vh. 


BIZONYÍTÁS: Legyenek yw;— —A -B2if, i — 0, ...,N, xy — —A 4 (21—1)4, 
i— I, . . . N, az N-szintű egyenletes kvantáló intervallumainak határai illetve kvan- 
tálási szintjei. Így a torzítás 
N YNi 
DOW-Y f 6— wz f(x) d 
i—1 
IN i—1 


ZANÉZA 


Definiáljuk az f(x) szakaszonként konstans sűrűségfüggvényeket a következő- 
képp: 


YNi 


fn(x) — E J f(z) dz, ha x € (XN gYng—1] - 
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Számítsuk ki az fv(x) szerinti torzítást, D(Ow)-et. Mivel az fw(x) konstans a 
(Vw..Yw 1-1] intervallumokon, azt kapjuk, hogy 


j 
D1z 
sség 
ÉSI 
] 
És 
2 
G 
zt 


D(Ow) 


2 
daN 

EA 2.A 
12 42.18) 


A tételt tehát beláttuk, ha be tudjuk bizonyítani, hogy 


tm X2N)—B(AN) im PA2N)—P(On) 
N—os D(On) N—os g/12 








— 0. (2.14) 


Ennek bizonyításánál használjuk ki az f(x) folytonosságát. Mivel az f(x) a [—4A, A] 
intervallumban folytonos, ezért itt egyenletesen folytonos, tehát mivel gy — 0, ha 
N — os, adott € 5 0 esetén elég nagy N-re 


[f()—fOo)lcae  hax,y € (9wi—-nyna], 1— 1, . . . , N. 


(x)— fw(x) 
Ilyen nagy M-ekre írhatjuk tehát, hogy 








12 3 
az ID(Ow) — (Ow) — 
N 
12 N IN IN. 
mo (xy) Ma- Ef 6—mdfebja] z £ 
e A yng ha 1 
LD N YNi B 
SZE f 6—rnft — frlodldr 5 
N i-I 
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— 2Ae, 2.15) 


ahol a második egyenlőtlenségnél kihasználtuk, hogy If(x) — fv(x)I — e, és hogy 
Xxn.i-k az (Yywi,ywi—1] intervallumok közepén vannak. Mivel € tetszőleges volt, 
ezért (2.15) bizonyítja (2.149-et és ezzel a tételt beláttuk. ősi 


A jelsebesség 2.11. szakasz szerinti definíciójával az N-szintű kvantáló — 
mint forráskód — jelsebessége R — logNV-nek adódik, vagyis egy X; kvantált 
O(X;) értékét logN bit felhasználásával továbbíthatjuk illetve tárolhatjuk. Ve- 
gyük észre azonban, hogy a 0(X1), 0(X2),... valószínűségi változók sorozata 
egy diszkrét stacionárius forrás. Így tehát a 0(X1), 0(X.), . . . forrásra, mondjuk 
bináris kódábécét használva, változó szóhoszúságú kódolást alkalmazhatunk, és 
az 1.9. tétel szerint egy ilyen kód átlagos kódszóhossza a 0(X1), 0O(X2 ), . . . forrás 
entrópiáját felülről tetszőlegesen megközelítheti. A forrás entrópiája az 1.6. defi- 
níció utáni megjegyzés szerint H(O(X) ), amire tudjuk, hogy H(O(X1)) £ logN, 
tehát ha a 0(X;)-k nem egyenletes eloszlásúak, akkor további tömörítést érhe- 
tünk el. Ebben az esetben tehát a kvantáló entrópiája is érdekel minket, nem csak 
a torzítása. A következő tétel egy aszimptotikus összefüggést ad az egyenletes 
kvantáló szintjeinek száma és entrópiája között. 


2.5. tétel. Tegyük fel, hogy az X valószínűségi változó f sűrűségfüggvénye csak 
a [—A,A] intervallumon belül különbözik nullától, és f folytonos [—A, A]-ban. 
Tegyük fel továbbá, hogy a 


A 
H()—— f fedlogy 0) dr 
A 


integrál véges. Ekkor az X N-szintű egyenletes kvantálásának H(ON(X ) ) entró- 
piájára 


lim (How) -3-log Tv) — H(f). 


N—aco 


A tétel tehát azt állítja, hogy a kvantálási szintek N számának növekedésé- 
vel az egyenletes kvantáló entrópiájára a H(ON(X)) s H(f) — loggn közelítés 
érvényes. 


BIZONYÍTÁS: A bizonyítás során a 2.4. tétel bizonyításában bevezetett jelölése- 
ket fogjuk használni. Mivel f folytonos, ezért a differenciálszámítás Lagrange- 


Xx 
féle középértéktételét alkalmazva az F(x) — f f(z)dz deriválható függvényre, 
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azt kapjuk, hogy léteznek €w; € (yw.i, YN.,i—1] számok, amelyekre 


YNi 
7 f(x) dx — (Ni —INa— 1) F(ÉNg) — ga f(ÉN), i—1,...,N. (2.16) 


YN i—1 


Ezek szerint tehát 
N 
H(ON(X)) — 7 LAO) — xy j logP(ON(X ) — xi j — 
N § YNi YN.i 


J s 18814 60181 S 


üz y an f (8.1) log (an f (8.1) ) — 
i—1 


N N 
— E an f(éwv)logagv— Yan f(én) log f(éna). 217 
71 i—1 


Ekkor egyrészt (2.16) szerint 


YNi 


f feddr— —Ioggy, (2.18) 


IN i—1 


Diz 


N 
— Ef (év) logan — (—logan) 


II 
ja 


i 


másrészt 
Jim — $ anf(éxJlogf(éx) — — J redlasrogan (2.19) 


mivel a bal oldal a jobb oldali integrál Riemann közelítő összege. Összevetve 
(2.199-et (2.18)9-cal és (2.19)-cel, a tétel állítása adódik. HI 
Ha a 2.4. és 2.5. tételeket összevetjük, akkor könnyen belátható a 


Jim (H(Ow(X)) log /12D(Ow) ) — H 


aszimptotikus összefüggés az egyenletes kvantálás torzítása és entrópiája között. 
Ezt úgy is fogalmazhatjuk, hogy 


H(ON(X)) zs H(f) — log VI2D(ON) 
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nagy N-ek, vagyis finom (kis lépésközű) kvantálás esetén, ami egy hasznos köze- 
lítés lehet egyenletes kvantáló tervezésénél. 

A H(f) differenciális entrópia tehát a finom, egyenletes kvantáló kimeneté- 
nek a tömöríthetőségét méri, azaz valamilyen értelemben az eloszlás terjedelmét. 


PONT 


Megmutatjuk, hogy adott c szórású f sűrűségfüggvények közül a normális el- 


oszlás sűrűségfüggvényére a legnagyobb a H(f) differenciális entrópia. Először 


PONT A 


megmutatjuk, hogy ha f(x) és g(x) két, olyan folytonos sűrűségfüggvény, amelyre 


[rozé az 


8(z) 
integrál létezik és véges, akkor ez az integrál nemnegatív, és 0 akkor és csak akkor, 
ha f(x) — g(x) 
Legyen X egy valószínűségi változó f(x) sűrűségfüggvénnyel, és legyen Z — 
og egy másik valószínűségi változó. Alkalmazzuk erre a Jensen-egyenlőtlensé- 
geta —logz konvex függvénnyel: 


E(-log(Z)) 2 —log(EZ) 
- foz (52 fee 2 -tog( / 5ő5fe0 a) 
2 


— fog (free —log (/ sa) 
fregos íjas s 0 


Az egyenlőség feltétele szintén a Jensen-egyenlőtlenségből valamint f és g foly- 
tonosságából következik. 

Legyen most f(x) egy olyan sűrűségfüggvény, amelynek várható értéke 0, 
szórása o, és p(x) a 0 várható értékű és c szórású normális eloszlás sűrűségfügg- 
vénye, azaz 

1 aZ 
9(x) — sú 


. 4/2n6 
Bebizonyítjuk, hogy 


— [ dednotgdrz — [fd fd de 


amiből következik, hogy 
H(e) 2 H(J). 
Vegyük észre, hogy 


f oeddr— ( f(dax— 1 
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f 969 dx z f f692dx — 67 
miatt 


El (x) dx — 


— 969 (maz im) dr / (Jin f(rJdr — 
--n—s fodrasz fodédr [0 dr— 
Hz E; aA KS IZ TSÉÁSE 

- [109 (m-a ES -ő5) dx / 79) ) In f(x) dx 


- [fegntt d 


ami nemnegatív. 
Ebből az is következik, hogy 


H(f) 














TA 


H(p) — 


1 x 
— log (V2TG) - 5 loge — - 
1 
s 2 1og (2nec6? ). 


Hasonló technikával megmutatható, hogy az adott várható értékű és a nemne- 
gatív félegyenesre koncentrált sűrűségfüggvények közül az adott várható értékű, 
exponenciális sűrűségfüggvénynek a legnagyobb a differenciális entrópiája (2.7. 
feladat). 


A L1oyd-Max-algoritmus 


Nem egyenletes kvantáló tervezésénél azt a technikát alkalmazzuk, hogy az 
átlagos torzítás csökkentéséhez a bemenetet pontosabban közelítjük a nagyobb va- 
lószínűségű tartományokban, míg a kis valószínűségű tartományokban rosszabb 
közelítést engedünk meg, mint egyenletes kvantálás esetén. Ezt úgy tehetjük meg, 
hogy a nagyobb valószínűségű helyeken a kvantálási intervallumokat kisebbnek 
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választjuk. Amennyiben az intervallumok száma konstans, ez egyben azt is je- 
lenti, hogy a kisebb valószínűségű helyeken nagyobb intervallumhosszakkal dol- 
gozunk. (Ez hasonlatos ahhoz, hogy veszteségmentes tömörítés esetén az átlagos 
tömörítési arány javításához a kisebb valószínűséggel előforduló forrásszavakhoz 
hosszabb kódszavakat rendelünk.) 

Egy adott X valószínűségi változóhoz keressük az N szintű, optimális 0 kvan- 
tálót. Feladatunk az xj C x2 — ::: C xy kvantálási szintek és a 0(X) függvény 
meghatározása úgy, hogy a D(0) négyzetes torzítás minimális legyen. Bebizo- 
nyítható, hogy egy optimális kvantáló kielégíti az alábbi két szükséges feltételt: 


1. Legközelebbi szomszéd feltétel: 
— 069 — min he— za] vxeR, 


vagyis minden valós x kvantált 0(x) értéke legalább olyan közel van x-hez, 
mint bármely másik kvantálási szint. 


2. Súlypont feltétel: 
Minden x; kvantálási szint megegyezik azon X; minták átlagával, amelyeket 
erre a szintre kvantálunk (O(X;) — xj). 


Az 1. és 2. feltételt együtt Lloyd-Max-feltételnek nevezzük, az ezt kielégítő 
kvantálót pedig LIloyd-Max-kvantálónak. Ha egy kvantáló nem elégíti ki a LIloyd— 
Max-feltétel bármelyik részét, akkor lehetséges egy olyan kvantálót készíteni, 
amelynek négyzetes torzítása kisebb, tehát egy nem L1oyd-Max-kvantáló nem 
lehet optimális, de létezik nem optimális L1loyd-Max-kvantáló is. 


2.1. példa. Legyen az X valószínűségi változó az ( I , 2, 3, 4 ) halmazon egyenletes 
eloszlású. Pontosan 3 féle 2-szintű Lloyd-Max-kvantálót alkalmazhatunk erre: 








91(1) — I; 21(2) — 218) —291(4) —3 
02(4) — 4; 92(1) — 22(2)— 228) —2 


93(1) — 93(2)—1.5;  93(3)—03(4)—3.5 


01 és 02 négyzetes torzítása egyaránt 0.5, míg 03-é 0.25. Annak ellenére, hogy 
mindhárom L1oyd-Max-kvantáló, csak 03 optimális. 








Feltesszük, hogy a kvantálandó X valós valószínűségi változó eloszlása az 


PT 


abszolút folytonos f sűrűségfüggvénnyel adott. Ekkor a Lloyd-Max-feltétel az 
alábbiak szerint alakul: 
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1. Legközelebbi szomszéd feltétel: 


(— Xi-TXi-i 
Ji — 2 ; 
ahol y;. 1 és y; annak az intervallumnak a két végpontja, amelyet x; szintre 
kvantálunk. (Az nyilvánvaló, hogy minden kvantálási tartomány interval- 
lum.) 


i—1,2,...,N—1, 


2. Súlypont feltétel: 


T xfírjdx 


2 Yi—1 


SES i—1,...,N, 
J f()dx 
Fis1 


vagyis minden kvantálási szint a saját kvantálási intervallumának súlypontja. 


2.6. tétel (Fleischer). Legyen az f(x) sűrűségfüggvény pozitív értékű és loga- 
ritmikusan konkáv (vagyis log f(x) legyen konkáv). Ekkor egyetlen N-szintű 
L1oyd-Max-kvantáló létezik az f(x)-re, így ez egyben az egyetlen optimális kvan- 
táló is az f(x) -re. 

2.2. példa. Legyen f(x) az egyenletes eloszlás sűrűségfüggvénye [a, b]-n. Köny- 
nyű ellenőrizni, hogy az N-szintű egyenletes kvantáló az [a, b] intervallumon ki- 
elégíti a Lloyd-Max-feltételt az f(x)-re. Az egyenletes eloszlás logaritmiku- 
san konkáv, ezért az N-szintű egyenletes kvantáló az egyetlen optimális N-szintű 
kvantáló az egyenletes eloszlásra. 


Az algoritmus: 
A kvantálót egyértelműen jellemzik az x; kvantálási szintek és a B; — (yi. 1,y:) 
tartományok. Célunk a szintek és az intervallumhatárok javítása lépésről lépésre. 


1. Vegyünk fel egy közelítést a kvantálási szintekre. 


2. Optimalizáljuk a kvantálót a kvantálási szintek szerint, vagyis határozzuk 
meg az intervallumhatárokat a legközelebbi szomszéd feltétel kielégítésé- 
vel. 


3. Számítsuk ki, hogy mennyivel csökkent a torzítás, és ha ez egy előre meg- 
határozott küszöbértéknél kisebb, akkor készen vagyunk. 


4. Optimalizáljuk a kvantálót az imént kapott intervallumokhoz, vagyis alkal- 
mazzuk a súlypont feltételt, és folytassuk az algoritmust a 2. ponttól. 
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kompresszor kódoló dekódoló expander 











—d y-G) [— I x-20) F— 5-2), d FG) [fe 



































fesz ezzen zség kvantáló (Fdlszlszáge ász álsz tézist az sztszlszlaa 











2.2. ábra. Kompanderes kvantáló. 


Kompanderes kvantáló 


A kvantálásra a gyakorlatban általában olyan alkatrészek érhetők el, melyek- 
kel egyenletes kvantálást valósíthatunk meg. Ebben az esetben a kvantált értéket 
kell tömöríteni. Gyakran ezt nem akarjuk megtenni, sokkal inkább azt szeretnénk, 
hogy rögzítve a kvantálási szintek számát, N-et, minimalizáljuk a négyzetes torzí- 
tást. Ezt úgy tesszük, hogy a kvantálandó jelet egy monoton növekedő függvény- 
nyel, a kompresszorral a [3 5 ]-be képezzük, ott alkalmazunk egy egyenletes 
kvantálót, és a kvantált értéket a kompresszor inverzével (az expanderrel) visz- 
szatranszformáljuk (2.2. ábra). (kompander — kompresszor -t- expander) 

A leggyakrabban alkalmazott nemegyenletes kvantálók a logaritmikus komp- 
resszor karakterisztikát használó eszközök, amelyek a távközlő hálózatokban a 
beszédkódolást végzik a "60-as évek óta. Azért alkalmaznak logaritmikus kvantá- 
lást, mert az emberi beszédben a kis amplitúdójú jelek az érthetőség szempontjá- 
ból rendkívül fontosak, ezért a lehető legnagyobb pontossággal kell ezeket kvan- 
tálni, míg a nagy amplitúdójú jelek esetében a túl nagy jelszintet kell megakadá- 
lyozni. A beszédkódolásban kétféle kompander használatos: a 1-law és az A-law. 
Az előbbi az Egyesült Államokban, Kanadában és Japánban elterjedt. Kompresz- 
szor ill. expander függvénye: 


In (1 
Gu(x) szi ERR egg —1€cxxX1 
In(1-- 4) 
st 1 
GT" (x) sz; 7 (1-ebl— 1) sgna —1cxc£1 


A u paraméter értékét általában 255-nek választják. 
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0.67 


0.47 


0.27 





-O.1 — —0.08 —-0.06 — -—0.04  -0.02 0.02 "0.04 — 0.06 —— 0.08 0.1 








2.3. ábra. A-law és u-law kompresszor függvények. 


Az Európában, Afrikában, Ausztráliában és Dél-Amerikában alkalmazott A- 
law kompandere az alábbi (A — 87.06): 











A 
3 SZÉL sgnx, 0€h]a A 
Al) ús 1-Hn]Axl] 1 
TrmA senx, 3Sk]s1l 
1-HnA 
8 kilzttál ga, OZ c rekez 
GY 6) — elri(1--In4)—1 1 
— a SENX, Ira S xIS1 


Az alapvető különbség az A-law és a u-law karakterisztika között, hogy az A- 
lawnak kicsit szélesebb a dinamikatartománya (értékkészletének terjedelme), míg 
a u-lawnak egy kicsit kisebb az alapzaja. A 2.3. ábrán látható a két kompresszor 
függvény. A különbség csak a 0-hoz közeli tartományban figyelhető meg, ezért 
a [—0.1,0.1] intervallumban ábrázoltuk a őket (a vízszintes tengelyhez közelebb 
haladó görbe az A-law, míg a távolabbi a u-law). 

A finom, egyenletes kvantáló négyzetes torzítása kiterjeszthető a kompande- 
res esetre. Jelölje G(x) a kompresszort és g(x) — G"(x) a deriváltját. Legyenek 
1 


ssel a: LY, Jt szeg 
2 0 1 N 2 
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a transzformált intervallumban a kvantálási határok, yi; — yi; , — g" — 1 és 
y-— GW), i— 1,2,...,N—1 
a valós kvantálási határok. Ekkor az i-edik kvantálási lépcső nagysága 
di — Yi — Vi—1- 


A (2.139-hoz hasonlóan beláthatjuk, hogy 


Ji 


SEK 





i—L; 
ki J f(2dz 
ei 1 Yi—1 ői 
I? FT EGEGGENY 











mez TIrző B-re Yi —y1-1) 
17 


valamilyen yj-1 £ z; 2 yi-re. A 





az 


f(z) 





egy integrálközelítő-összege. Azt kaptuk, hogy 


f(z) 
MEZ SZST 








PT 


Ismerve az f(x) sűrűségfüggvényt, megkereshetjük az , optimális" kompandert. 
Ehhez felhasználjuk a Hölder-egyenlőtlenséget. 
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2.1. lemma (Hölder-egyenlőtlenség). Legyen p,ag 2 1 úgy, hogy 5 dé —- 1. Ek- 
kor, ha h1(x) és h2(x) két olyan függvény, hogy 


finegpax és f atolrax 


véges, akkor 


] Mal dx c (/ Moran)" (reed) j 


Alkalmazzuk a Hölder-egyenlőtlenséget p — 3, g — 3, hi(x) 





I 
gátlás § 
je 
ze 
SE 

1 


h2(x) — 8 (x) szereposztásban: 


f JAVA fej des Es J kilógott 


AN 
SLTTTS 
Mel 
s 
finyöoj 
6 
N— 
E 
sz 
TS 
e. 
s 
u 
kia 
[00] 
BEÉS 
— 
E 
SZ 
! 








I 
en 
ee 
s 
ő 
a SS előt. AGÁR 
Val 





ahol kihasználtuk, hogy f g(z)dz— G(22)—G(—o0) — 3— (—3) — 1. Azt kaptuk, 


hogy 





fe) ( J 1/8 ) 
dcz( [ff 7 (e)dx] , 
1 87) 11 
és visszahelyettesítéssel ellenőrizhetjük, hogy ezt az optimumot akkor érhetjük el, 
ha 
1/3 
KEY — , FLBTA f(x) 
x)—c Xx)— ———-— —, 
§ ( ) Jf ( ) ff (2) dz 
következésképp 
Xx 
TE dz 


G(x) — 1— ; 


00 


5 f3(2)dz 


—oo 
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Vektorkvantálás 


A forrás kimenetének többdimenziós eloszlását felhasználva kisebb torzítást 
érhetünk el ugyanakkora bit/minta arány mellett vektorkvantálással. A forrásszim- 
bólumok egyenkénti kvantálása helyett (ahogyan azt skalár kvantáló esetén tettük) 
szekvenciákat, vektorokat képezünk belőlük, s ezeket együtt kvantáljuk. (Tekint- 
sük például a kétdimenziós esetet. Skalár kvantáló alkalmazása esetén — egy- 
másra merőleges tengelyeket feltételezve — téglalap alakú tartományokat kapunk 
a síkban, míg vektorkvantálóval bármilyen szabálytalan síkidom alakú (például 
kör) tartományok kialakíthatók.) 

Tegyük fel, hogy a forrásunk emberek magasság- és tömegadatait generálja. 
Ezek például 100 és 200 cm, illetve 20 és 120 kg közé esnek. Ha összesen 6 
biten szeretnénk kvantálni az adatainkat, és skalár kvantálót alkalmazunk, akkor 
3-3 bit jut a magasságra és a tömegre egyaránt. Az intervallumokat 8 egyenlő 
részre osztva, azok közepén kijelölve a szinteket (a szemléletesség kedvéért kétdi- 
menziós koordinátarendszerben ábrázolva az így lehetséges kvantálási pontokat: 
magasság-testtömeg koordinátájú pontok), egy (22 kg, 197 cm) adatpárt ugyano- 
lyan torzítással kvantálunk, mint egy (70 kg, 180 cm)-est. Holott nyilvánvalóan az 
előbbi adatpár nem fog előfordulni, míg az utóbbi gyakori lesz. Vektorkvantálás 
alkalmazásával megtehetjük, hogy például a statisztikai vizsgálatok szerint leg- 
gyakoribb magasság-testtömeg egyenes környezetében biztosítunk kis torzítást, 
míg a gyakorlatilag lehetetlen adatpárok esetében megengedünk nagyobb torzí- 
tást is. 

Legyen X egy d-elemű forrásvektor f(x) sűrűségfüggvénnyel. A d-dimenziós 
vektorkvantáló egy 0(x) függvény, amely az x c R7 bemenetet az XI, X2 , . . . XN E 
TR" vektorok egyikébe képezi le. A kvantálót egyértelműen jellemzi az N ki- 
meneti vektor, és a hozzájuk tartozó B1, B2, . . . , Bu. tartományok, amelyek R/ 
egy partícióját alkotják (diszjunktak, és lefedik IRJ -t), tehát 0(x) — x;, ha x € B;, 
i—-1,2,...,N. A torzítás vizsgálatára továbbra is a négyzetes torzítási mértéket 
fogjuk használni: 


N 
D(2) — 5EIX—209?- Ef Ix—slfifgdx 


ie: EB; 


ahol [/ - [[ az euklidészi norma. 

Vektorkvantáló tervezése adott torzítási mértékre ismert bemeneti eloszlás 
esetén a B; tartományok és az x; kimeneti vektorok meghatározását jelenti. Míg 
egydimenziós esetben ez viszonylag egyszerű problémát jelentett, hiszen csak a 
valós egyenes intervallumai jöhettek számításba, addig most még B;-k alakjára is 
végtelen sok lehetőségünk van. A torzítás szempontjából optimális megoldás B;-k 
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2.4. ábra. Hatszögminta. 


alakjára a kör, a gömb, illetve magasabb dimenziókban a hipergömb lenne. Sajnos 
azonban ezekkel az alakzatokkal nem lehet hézagmentesen lefedni (csempézni) a 
teret, pedig minden lehetséges bemeneti vektorhoz pontosan egy kimeneti vektort 
kell hozzárendelnünk. Kétdimenziós esetben jó közelítést jelent a síkot lefedő 
szabályos hatszögminta, amely a 2.4. ábrán látható. 

Egy optimális vektorkvantáló kielégíti az alábbi két szükséges feltételt, me- 
lyek az egydimenziós eset kézenfekvő általánosításai: 

1. R! partíciója Dirichlet-partíció, vagy más néven tartományai Voronoi-tar- 

tományok, azaz 


B; — (x : IIx— s £ IIx—x;il, vi A it 
2. A kimeneti vektorok a hozzájuk tartozó tartományok súlypontjai: 


Xi — argmin  IIx— yI2.7(39 dx. 
vállt 


A L1oyd-Max-algoritmus általánosításaként vektorkvantálás esetén a Linde— 
Buzo-Gray-algoritmus használatos: 


1. Vegyünk fel egy közelítést a kvantálási vektorokra. 


2. Optimalizáljuk a kvantálót a kvantálási vektorok szerint, vagyis határozzuk 
meg a tartományokat a Voronoi-tartományokra vonatkozó feltétel kielégíté- 
sével. 


3. Számítsuk ki, hogy mennyivel csökkent a torzítás, és ha ez egy előre meg- 
határozott küszöbértéknél kisebb, akkor készen vagyunk. 


4. Optimalizáljuk a kvantálót az imént kapott tartományokhoz, vagyis alkal- 
mazzuk a súlypont feltételt, és folytassuk az algoritmust a 2. ponttól. 
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2.5. ábra. Fa-struktúrájú vektorkvantáló. 


A Linde-Buzo-Gray-algoritmussal tervezett vektorkvantáló kódkönyvének ál- 
talában nincs megfigyelhető belső struktúrája. Ez a , véletlenszerű" szerkezet 
megnehezíti ugyan a kvantálási folyamatot, de ez biztosítja a vektorkvantáló közel 
optimális torzítását. Több megoldás létezik struktúrált, de ugyanakkor kedvező 
torzítással rendelkező vektorkvantáló tervezésére. 

A fa-struktúrájú vektorkvantáló alapelve az, hogy az L — K" kimeneti vek- 
tor közül a közel optimálisat egy d mélységű és K-adfokú fa segítségével keressük 
meg. Egy szint egy bejegyzése a következő szint egy K darab vektort tartalmazó 
halmazára mutat. Így összesen legfeljebb d [logXK] összehasonlítást kell végre- 
hajtanunk a teljes keresés K! összehasonlítása helyett. A 2.5. ábraad —2,K— 3 
esetet szemlélteti, ahol az első koordináta szerint alkalmazunk egy skalár kvantá- 
lót, majd részintervallumonként külön tervezünk egy skalár kvantálót a második 
koordinátára. 

Néhány alkalmazásban, mint például a beszédfeldolgozásban, a bemeneti jel 
dinamikatartománya széles skálán változhat. Az ehhez szükséges nagy kódkönyv- 
ben való keresés helyett először normáljuk a vektort, majd külön-külön kvantáljuk 
a normalizált vektort, és a normalizáló faktort. A normalizáló faktor a dinamika- 
tartománybeli helyet, vagyis az energiát határozza meg, míg a normalizált vektor 
a jel formáját, így ezt a technikát energia-forma vektorkvantálónak nevezzük. 

Osztott vektorkvantálás esetén a forrásvektorokat független osztályokba so- 
roljuk térbeli tulajdonságuk alapján. A különböző osztályokhoz különböző vek- 
torkvantálókat tervezünk. Ez a technika előnyös például a képtömörítésben, ahol 
az éleket tartalmazó illetve nem tartalmazó tartományok két eltérő osztályt alkot- 
nak. 
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Többszintű vektorkvantálás esetén több menetben dolgozunk. Először egy 


24 


alacsony bitarányú kvantálóval előállítjuk a bemenet durva közelítését, majd lé- 
pésről lépésre mindig az eredeti bemenet és az előző szint által előállított közelítés 
eltérését (a kvantálási hibát) kvantáljuk. 

A képek több nagyobb, közel egyszínű , foltot" tartalmaznak, így jól működik 
az a megoldás, hogy a képpontok (blokkonkénti) átlagát egy skalár kvantálóval 
kvantáljuk, majd a képpontokból kivonva ezt az átlagot egy vektorkvantálót alkal- 


mazunk. 


2.3. Lineáris szűrés 


A részsávos kódolás (subband coding) bevezetéséhez és a mintavételezéshez szük- 


ZANÉZA 


ségünk van a gyengén stacionárius folyamat spektrális sűrűségfüggvényének és a 
gyengén stacionárius folyamatok lineáris szűrésének fogalmára. Legyen X (zt) egy 
0 várható értékű, R(T) kovarianciafüggvényű gyengén stacionárius folyamat, azaz 


R(T) — E(X(t1-7)X(t)) 
minden £-re. Ekkor R(T) pozitív szemidefinit, tehát tetszőleges f(t) függvényre 
f j R(t— s) ff (s dtds 3 0. 
Ezt úgy láthatjuk be, hogy megmutatjuk, hogy a bal oldal 


2 
E ([dorosr) I 
ami nemnegatív. 


Tegyük fel, hogy R(T)-nak létezik a Fourier-transzformáltja: 


5(w) — J R(rJej9 dr. 


2999 


s(w)-t az X(t) folyamat spektrális sűrűségfüggvényének nevezzük. R(r) szim- 
metriája miatt s(4) is szimmetrikus, továbbá R(T) pozitív szemidefinit tulajdon- 
ságából következik, hogy 

s(w) 2 0. 


Legyen h(t) egy négyzetesen integrálható függvény: 


f 107 at £ 00. 
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Ekkor az X (z) folyamat lineáris szűrésén az 
Y (r) — fox —sjds 


folyamatot értjük. (A határértéket négyzetes középben vesszük.) Belátható, hogy 


Y(t) is egy 0 várható értékű, gyengén stacionárius folyamat. h(t)-t a szűrő súly- 
függvényének nevezzük. A h(t) Fourier-transzformáltját átviteli függvénynek 
nevezzük: 


H(w) — J h(rJejet dr. 


2.3. példa. Legyen 0 c b — B, és 


- ![ L halol e [5.8] 
Ho) - 0, egyébként 


PZNYZ4 29 28 


Az ilyen átviteli függvényű szűrőt ideális sávszűrőnek nevezzük, mert az 
X(t) — Asin(ot 3-p) 


gyengén stacionárius folyamat szűrtje X(t), ha [wo] e (b, B], és azonosan 0 egyéb- 
ként. (Itt p a (0, 27]-ben egyenletes eloszlású.) 
Számoljuk ki az Y (t) szűrt folyamat R(T) kovarianciafüggvényét: 


R(r) — EG(IY(0))— 


I 

e 
( 
BE 8 


h(9)X(t—s) ds ( NDX(0— dr és 
h()R(DYE(X(t— 5) X(—r)) dsdr — 


h(s)h(t)R(T--t — s) dsdt — 


I 
ggg 
g B ggg 


TÖTOSS ft s (eg) dindsdt — 


JT J h(s)h(rJe7P(r— dsdt ] e" s(w)do — 


—o009 — oo 


II 
BI - 
goa 
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1 f 3 
5 hi IH(0) Pe i""s(wdo 


(Az integrálások sorrendjének felcserélhetőségét most nem ellenőriztük.) 
Ez alapján kiszámíthatjuk a szűrt folyamat teljesítményét: 


as 1 f 
E(Y(07) — (0) — -- f Io) Ps(oj do. 
A sávszűrő esetén 


lojelb B] 


és ez indokolja a spektrális sűrűségfüggvény elnevezést. Folytonos s5(40) és kis 


B — b (tűszűrő) esetén R(0) sz 2 " 2(B — b)s(b), a szűrt jel energiája közelítőleg 
2(8—b)s(b). 


2.4.  Mintavételezés 


Legyen X(t) egy 0 várható értékű, gyengén stacionárius folyamat R(T) kovarian- 
ciafüggvénnyel és s(w) spektrális sűrűségfüggvénnyel. Az X(t) folyamat most 
mind időben, mind értékkészletében folytonos, tehát egyáltalán nem nyilvánvaló, 
hogy mikor lehetséges torzításmentes adattömörítés. Ebben a szakaszban mód- 
szert mutatunk az idő , diszkretizálására", ez a mintavételezés. LegyenT 50 a 
mintavételi idő, az (X(KT), k — 0,7-1, 1-2, . . . ) diszkrét idejű folyamatot az X(t) 
folyamat mintavételezésének nevezzük. 

Az a kérdés, hogy a mintavételezésből mikor reprodukálható az X(z) tökéle- 
tesen. 


Választunk egy interpoláló függvényt: 








— 











. sin(mt) 
10, 
Nyilván f(0) — 1 és f(k)—0, k—-1,-42,.... 














Definiáljuk a reprodukciót: 


£0- Y XKT)f G -k), 


k——oo 
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vagyis a T-vel átskálázott interpoláló függvény X (XT )-szeresét eltoljuk a k-adik 
mintavételi pontba, és ezeket a függvényeket összegezzük. A végtelen összegzés- 
ben a határértéket négyzetes középben értjük, azaz 


Tim E [0- 3 xénr(4-1)) e; 
k—-—N 


Nyilván ft — KT esetén 
£() —X(7), 


vagyis a mintavételi időpontokban a reprodukció tökéletes. 


2.7. tétel (Mintavételi tétel). Ha az X(t) folyamat B sávra korlátozott, vagyis 


akkor minden t-re 
P(X(r) —X(1))—1. 


Ha bevezetjük a B" — . frekvenciát, akkor a mintavételi tétel 7-re az alábbi 
feltételt adja: 
1 


T s 
S 2p 


vagyis a mintavételi frekvencia legalább a B" duplája legyen. 


MEGJEGYZÉS: A mintavételezés egy olyan forráskódolási eljárás, amikor a foly- 
tonos idejű stacionárius folyamatot a mintáiba kódolunk, és a reprodukció inter- 
polációval történik. Vegyük észre, hogy ez a tökéletes reprodukció csak egy elvi 
lehetőség, hiszen az interpoláció az összes, tehát végtelen sok mintát használ. 


ze 


Megmutatható, hogy ez az interpoláció megvalósítható ideális sávszűrővel. Ez a 
sávszűrő annál jobban közelíthető realizálható szűrővel, minél nagyobb a minta- 
vételi frekvencia a sávszélesség duplájánál. Így például a telefóniában a beszédet 


3400 Hz-re sávszűrik, és azt 83000 Hz-cel mintavételezik. 


A mintavételi tétel bizonyításához előbb egy lemmát bizonyítunk: 
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2.2. lemma. Legyen i 
H.(w) — Yet 9 f(r—k), 


k 


ekkor [w] a m esetén 


BIZONYÍTÁS: Jelölje 


H(w) — fe fa 
az f(t) interpoláló függvény Fourier-transzformáltját! Először megmutatjuk, hogy 


. J 1, haljojámn 
vEK0) - ( 0, egyébként 


ugyanis 
00 TT 
EB f Feje don s az [777do 
2n 2n 
— 00 —n 


1 Ki 
27[—jt] , 
e Jat. ejít 

NI —2njt NI 
sin (mt) 





nt 


— f(), 


tehát H(w) inverz Fourier-transzformáltja f(t). 
Írjuk fel a G,(w) — H(w)je7J"" függvény Fourier-sorát a [—x, n]-ben: 


G.(w) sz Ygxge79t, 
k 


ahol 


mn 
1 KN 
— — ]J G,(o)Je7-jokdo 
8kt r( Je 
—TT 


n 
1 5 
éz, s H(o — jot jok gy 
sad kejePÉe 
—Tn 
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2mn 
—n 
— f(t—k), 
tehát [w] a x esetén 
e jot — ELF kje7jek 


következésképp 


1—-H(o)—Y f(t— kejt 5 — H(0). 
k HI 


A 2.7. TÉTEL BIZONYÍTÁSA: 
Itt csak egy bizonyításvázlatot adunk, mivel nem ellenőrizzük a különböző felcse- 
rélések jogosságát. Megmutatjuk, hogy E(X (t) — X(t))? — 0, amiből már követ- 
kezik, hogy Pf(X(r) — X(t))— 1. 

E(X()—X(2)— E(GX(m)) —2EKDÁXG)) rEGD)) 220 
Számítsuk ki a három tagot! 


E(X2(r)) — E(X?(0)) — R(0) 021) 


A keresztszorzatnál kihasználjuk a sávkorlátozottságot és a 2.2. lemmát: 


E(X(DX(2)  — E(xoyxenr (4) Ez 
t 
ER(-KT)J (Fk) c 


00 


z 3 ml. e-Jot—T s(wjdof (G z k) — 


B 
1 — j0(t— KA 
- mee KT) 5 (adof (5 k) 


Vezessük be a tf" — - jelölést, ekkor 
B 
1 


ECX(NR()) — age [fel oj do f(r—k) — 


k 
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- oz TA H(OT)s(w) do — 


- az zata) 0) de — R(0), (2.22) 


amennyiben [wol7T a m, ami teljesül, ha BT — m, és ezt feltettük. Nézzük a harma- 
dik tagot! 


EX) — EXEG(TXUT))f (E S; (S -1) - 
j ZETA (6-1 ( -1) sz: 


e EE f/fetettstajdog (G -k) 7 ( -1) ez 


E: oz ! H(OT)H,(—oT)s (0) do — 


—oo 


éz oz Ji H(OT)H(—OT)s(w) do — 


B 
— az f5(0d0-R0) (2.23) 
—B 
A (2.20), (2.21), (2.22) és (2.23) miatt 
E(X (r) — X(r))? — R(0) —2R(0) 4-R(0) — 0. h 


2.5. Transzformációs kódolás 


Ebben a szakaszban olyan technikát mutatunk be, amelynek segítéségével a forrás 
kimenetét összetevőire bonthatjuk, és ezen összetevőket saját, jellemző karakte- 
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risztikájuk szerint kódoljuk. 

A transzformációs kódolás a vektorkvantálás egy speciális esete. AZ opti- 
mális vektorkvantáló nagy számítási bonyolultságú, míg a struktúrált vektorkvan- 
táló nem optimális. A transzformációs kódoló megkísérli a kettőt ötvözni: előbb 
transzformálja a jelsorozatot, majd a transzformált sorozat komponenseit kvan- 
tálja skalár kvantálókkal. Ez így együtt egy struktúrált vektorkvantáló. Ugyanak- 
kor az egyes komponenseket más és más finomságú skalár kvantálóval kvantáljuk, 
tehát a vektorkvantáló reprodukciós vektorai egy olyan többdimenziós rácsot al- 
kotnak, melyet megkaphatunk egy többdimenziós téglatest eltolásaival. 

A transzformációs kódolás lépései a következőek: 

Először osszuk fel a kódolandó íxn ) jelsorozatunkat k hosszú diszjunkt blok- 
kokra. Minden egyes blokkra alkalmazzunk egy invertálható transzformációt, 
mely az (ya) sorozatot eredményezi. 

Másodszor, kvantáljuk a transzformált sorozatot. Az alkalmazott kvantálási 
stratégia függ a kívánt bitsebességtől, a transzformált sorozat különböző részeinek 
eltérő statisztikai tulajdonságaitól és a megengedhető torzítástól. 

A harmadik lépésben kódoljuk a kvantált értékeket valamilyen bináris kóddal. 

A továbbiakban csak lineáris transzformációval foglalkozunk. Ekkor a transz- 
formált sorozat a következő alakban áll elő: 


k—1 
Yn — )3 dniXi 
1—0 


Az (yn) sorozat elemeinek eloszlása a sorozaton belül elfoglalt pozíciótól, n-től 
függ. A transzformált sorozat elemei eloszlásának terjedelmét a 62 szórásnégy- 
zZettel mérjük. Ez fogja befolyásolni, hogy hogyan kódoljuk a transzformált soro- 
Zatot. 

Az eredeti sorozat helyreállítható a transzformált sorozatból az inverz transz- 
formációval: 


k—1 
Xn — )3 bn gyi 
1—0 
Ugyanezek mátrixos alakban: 
y—-— Ax 
x- By 


ahol A és B k x k-as mátrixok, melyek i, j-edik eleme a; ; illetve b; j, és 
AB-—-BA-—-I 


vagyis 
B—-A-!. 
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A képtömörítésnél használt kétdimenziós esetben: 
Y—-AXAT 


X —BYB/ 


Ezek gyakran ortonormált transzformációk, vagyis a transzformáló mátrix inverze 
megegyezik a transzponáltjával: B — A7! — AT , így 


X — ATYA. 


Az ortonormált transzformáció megőrzi az energiát, vagyis az eredeti és a 

transzformált sorozat négyzetösszege egyenlő. Például egydimenziós esetre: 
k—1 k—1 
)3 yi —yíy — (Ax)TAx — XT AT Ax — xx — 9 xZ , 
i—0 1—0 

ahol kihasználtuk az ortonormáltságot, hiszen ATA — A7JA —I. 

Szerencsés esetben az y egyes komponenseinek nagyságrendje különböző, te- 
hát az egyes kvantálók különböző számú kvantálási szintet használnak. Ez a bit- 
allokáció problémája. Tegyük fel, hogy a k hosszú blokk-kódolására M bitet szá- 
nunk úgy, hogy a j-edik kvantáló M; bitet használhat, azaz kvantálási szintjeinek 
száma 2M;. A skalár kvantáló entrópiája a H(f) differenciális entrópiától függ, 
amely normális eloszlás esetén 3 log (2me0?). Az X lineáris transzformáltjának a 
komponensei nagy k blokkméret esetén a centrális határeloszlás tétel miatt köze- 
lítőleg normális eloszlásúak, tehát indokolt, hogy a j-edik kvantáló 


M; -C-Tt logo(T;) (2.24) 


bitet kapjon. Ekkor 


k—1 
(c-4-logo(Y;)) — M, 


j—-0 


kes 
II 


ahonnan a c konstans kiszámolható: 


K-i 
M— ?Y logo(y;) 
j—0 


k 


A gyakorlatban három transzformáció terjedt el leginkább. A diszkrét koszi- 
nusz transzformáció (DCT) k x k-as A mátrixának első sorában csupa 77 elem 


áll, míg az ez alatti elemek az 


as — gyes (A-D) 





T ésátsszsi 





2.5. TRANSZFORMÁCIÓS KÓDOLÁS 97 


képlettel számolhatók. A DCT a legkedveltebb transzformáció, felhasználja a 
JPEG és az MPEG álló- illetve mozgóképtömörítési szabvány is. 
A diszkrét szinusz transzformáció (DST) k x k-as mátrixának elemei: 


éle ES sin Hál 
BV KET KET 


Az egyszerűbb diszkrét Walsh-Hadamard-transzformáció (DWHT) kisebb 
számításigényű, de általában nem biztosít olyan jó tömörítési hatásfokot, mint a 
DCT. A transzformáló mátrixot a következő rekurzióval kapjuk: 


d Aok-1 Aor-i 
é50k bé Úr VAb 





A kiinduló mátrix pedig: 


0 (A AN (1 1 
a2- (4 kö ző 59 


A mátrixok kielégítik az AA — 2AT feltételt, és a transzformáció során ennek 
a normalizáltjával dolgozunk. A 8 x 8-as DWHT transzformáló mátrixa így a 
következő: 


Így például: 








1 1 1 I 4. 4. d 
1 —-1 1 —-1 1 —-1I 1 -—I 

1  1.-I.-i TT "1 -T -i 

ún JE Sal 1 —1 —-1 1 
vV811 1 1 —1 —1 —I 
T -d disz at eg eds 4 

1 1 1-1 1 1 

1 —1 —-1 1-1 1 1 -—I 


A transzformációs kódolás leggyakrabban használt megvalósítása a részsávos 
kódolás. Alapötlete, hogy a jelet nem a teljes sávszélességében kódoljuk, hanem 
frekvenciasávonként. 

A részsávos kódolás egy gyakorlati megvalósítása látható a 2.6. ábrán. A 
forrás kimenetét egy szűrőbankon visszük keresztül, amely a jelet az összetevő 
frekvenciasávokra bontja szét. A szűrők kimenetén kapott frekvenciasávok le- 
hetnek átlapoltak és nem átlapoltak (a teljes sávot egyszeresen lefedők). Ezután 


PZL d 


mintavételezzük az egyes szűrők kimeneteit. A mintavételi törvény szerint az 
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2.6. ábra. Részsávos kódoló. 
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elemi sávszélességek kétszeresével kell ezt megtennünk a visszaállíthatóság ér- 
dekében. Tehát a minták számát csökkenthetjük a szűrők kimenetén, hiszen itt 
kisebb a sávszélesség, mint a szűrőbank bemenetén volt. Ezt decimálásnak vagy 
alulmintavételezésnek (downsampling) nevezzük. A decimálás mértéke a szűrő 
bemenetén illetve kimenetén lévő sávszélességek arányától függ. A decimálás 
után következik a kódolás. A kódolt jelet átküldjük a csatornán, majd annak túl- 
oldalán dekódoljuk. Felülmintavételezzük (upsampling), vagyis a minták közé 
megfelelő számú 0-t illesztünk, így állítva vissza az eredeti másodpercenkénti 
mintaszámot. Végül egy szűrőbankon vezetjük keresztül a jelet, amely elvégzi a 
fordított transzformációt, s így a kimeneteit összegezve kapjuk a végleges jelet. 
Felmerülhet a kérdés, hogy miért jó ez az egész? Az emberi érzékszervek, 
akár a hang, akár a (mozgó)kép érzékelés terén frekvenciafüggőek. Ezt a tényt 
úgy használhatjuk ki, hogy az érzékelés szempontjából fontos frekvenciasávok 
pontosabb rekonstrukciójára törekszünk, míg a kevésbé fontos sávokban nagyobb 
torzítást engedünk meg. Másrészről az egyes szűrők kimenetén különböző a szó- 
rásnégyzet, és ennek megfelelően rendre különböző számú bitet allokálhatunk a 


kvantáláshoz a (2.24) egyenlet szerint, és ezzel lényeges tömörítést érhetünk el. 


2.6.  Prediktív kódolás (DPCM) 


A prediktív kódolás alapelvét először egy speciális esetben vezetjük be, amikor 
a predikció az előző minta (, meteorológus prediktor"). Ezt hívjuk különbségi 
kódolásnak. 

A különbségi kódolás alkalmazása egy adatforrásra akkor előnyös, ha a szom- 
szédos minták közti eltérés nem túl nagy. Például digitális képek esetén a szom- 
szédos pixelek közötti eltérés viszonylag kicsi, hacsak nem vagyunk egy él köze- 
lében. 

A következő példa rávilágít, hogy mit nyerhetünk a különbségi kódolással a 
memóriamentes kódoláshoz képest, vagyis amikor a mintákat egymástól függet- 
lenül kódoljuk. 


2.4. példa. Legyen egy 8 bites intenzitású digitalizált kép 8 egymást követő pi- 
xelének értéke: 


147, 145, 141, 146, 149, 147, 143, 145. 


Ha ezeket pontról pontra kódoljuk, egyenként 8 biten, akkor ehhez 64 bit szük- 
séges. Vegyük azonban a kódolás előtt ezen intenzitások különbségét oly módon, 
hogy az első képpont értékét változatlanul hagyjuk, majd minden további pixel 
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esetén azt az értéket tároljuk, amelyet az előző képpont intenzitásához hozzáadva 
a saját intenzitását kapjuk. Esetünkben ez a következő lesz: 


141,—2, 4.973, 725742: 


Világos, hogy az eredeti sorozat helyreállítható a második sorozatból. A kapott 
sorozatot egyszerűen vezessük át egy összegzőn. 

Először 8 biten átküldjük a dekódernek, hogy a különbségeket hány biten fog- 
juk ábrázolni (ez függ a legnagyobb megjelenítendő értéktől), majd szintén 8 biten 
átküldjük az első (változatlan) adatot. Esetünkben a legnagyobb különbségi érték 
az 5, ezért 4 biten fogjuk átküldeni a differenciákat (1 előjelbit 4- 3 adatbit). Így 
összesen 8 -- 8 -- 7 : 4 — 44 bitet használunk fel, ez 30 90-kal jobb tömörítési arányt 


jelent. 


Sajnos veszteséges tömörítés esetén nem ilyen egyszerű a helyzet: nem igaz, 
hogy adott hibahatáron belül helyreállítható ily módon az eredeti sorozat. Legyen 
a forrás kimenete: 


6.2, 9.7, 13.2, 5.9, 8, 7.4, 4.2, 1.8 
Képezzük a különbségeket: 
6.2, 3.5, 3.5, —7.3, 2.1, —0.6, —3.2, —2.4 


A veszteséges tömörítéshez használjunk egy 7 szintű kvantálót a következő kime- 
neti szintekkel: —6, —4, —2, 0, 2, 4, 6. A kvantált értékek: 


6, 4, 4, —6, 2, 0, —4, —2 
Ha most megpróbáljuk az eredeti sorozatot helyreállítani a szokásos módon, a 
6, 10, 14, 8, 10, 10, 6, 4 


értékeket kapjuk. Az eredeti és a rekonstruált sorozat között az eltérések: 





0.2, —0.3, —0.8, —2.1, —2, —2.6 


Látható, hogy egyre hosszabb sorozatokat vizsgálva a hiba folyamatosan nőhet. 

Vizsgáljuk meg ezt az észrevételt általános esetben! Legyen a bemeneti so- 
rozatunk (xn). A különbségi sorozat (d,). ahol d, — xn — xn-1. A különbségi 
sorozatot kvantáljuk, s így kapjuk (d,)-ot: 
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ahol g, a kvantálási hiba. A vevő oldalán a rekonstruált sorozatot, (Xn )-ot úgy 
kapjuk, hogy a kvantált különbséget hozzáadjuk az előző értékhez: 


ax ak 


Xn — Xn-1-b dn 


Tételezzük fel, hogy az adó és a vevő ugyanarról az értékről indul, tehát xo — X0. 
A kvantálás és a rekonstrukció első néhány lépése: 


di — Xx1—Xo 

di 09(d1) —d1-4- gi 

XI £0-4di —x0-bdi1-bgi —x1-d1 

d? X2—XI 

d; — 0(d)—d24 a? 

X £1-do—xi-4gid2tg2—x2 gib a2. 


Tovább folytatva, az n-edik lépés után: 


n 
Xn —Xn-k B d 
k—1 
Tehát a kvantálási hiba felhalmozódik. 

Vegyük észre, hogy a kódoló és a dekódoló különböző adatokon hajt végre 
műveleteket! A kódoló az eredeti sorozat különbségeit generálja, míg a dekódoló 
a kvantált különbségekkel dolgozik. Áthidalhatjuk ezt a problémát, ha az adót és 
a vevőt rákényszerítjük, hogy azonos adatokon dolgozzanak. A vevő az eredeti 
(xn) sorozatról csak a rekonstruált (xn) sorozatból szerezhet információt. Ez 
utóbbi viszont az adónak is rendelkezésére áll, így a különbségképzés műveletét 
a következőképpen módosíthatjuk: 


dn — Xn —Xn-1. 


Ezt felhasználva az előző lépéseink így módosulnak: 


di — x1—Xxo 

di — O(d)—di--ai 

fi — £9-4di—xotdi-4dgi—xi-a1 
d, — x2—£ 

da — O(d2)—d2--a2 


X2 f1-4d; —£1--d2tg2 —x2 7 82. 
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2.7. ábra. DPCM. 


Általánosítva: 


Xn — Xn Tt dn; 


tehát a kvantálási zaj nem akkumulálódik. 
Az a célunk, hogy minél kisebb különbségi értékeket kapjunk. Ehhez x,, érté- 


két nem csak £n-1 segítségével becsülhetjük, hanem a rekonstruált sorozat előző 
értékeinek függvényével is. Az ezt megvalósító eszköz a prediktor: 


Dn — fT(Xn-1,Xn—2, 4.§é ,£0). 


Itt a különbségképzés a 
dn — Xn — Dn 


kifejezéssel történik. Az eredő torzítás ebben az esetben sem halmozódik. Az ed- 
dig elmondottakat megvalósító rendszer a 2.7. ábrán látható, az eljárás neve kü- 
lönbségi impulzuskód moduláció (differential pulse code modulation, DPCM). 
Az eljárást a Bell Laboratóriumban dolgozták ki a "40-es évek végén, és főként a 
beszédkódolásban terjedt el, így széleskörűen használják a tellekommunikációban. 

A különbségi kódoló rendszerek, mint a DPCM, azzal érik el céljukat, vagyis 
a tömörítést, hogy csökkentik a bemeneti sorozat szórását és dinamikatartomá- 
nyát. A szórás csökkentése attól függ, hogy a prediktor mennyire jól tudja be- 
csülni a következő szimbólumot az előzőleg rekonstruáltakból. A 2.7. szakaszban 
vizsgáljuk a becslés problémakörét. 

A bemeneti jelek tulajdonsága változhat az időben. Ehhez tud alkalmazkodni 
az adaptív DPCM rendszer. Az alkalmazkodás történhet a kódoló bemenetére ér- 
kező jel (x,) alapján, ekkor előre adaptív módszerről beszélünk, vagy a kimenet 
(Xn) alapján, ez a hátra adaptív módszer. Előre adaptív esetben, mivel a dekóder- 
nek nem áll rendelkezésére a kódoló bemeneti jele, ezért a rendszer módosított 
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paramétereit is át kell vinni. Hátra adaptív esetben ilyen probléma nem merül fel, 
hiszen a kódoló kimenetét megkapja a dekóder. 

A kvantálót és a prediktort egyaránt tervezhetjük adaptívra (ADPCM), ez 
utóbbiról a 2.7. szakaszban szólunk. Előre adaptív kvantáló esetén a bemenetet 
blokkokra bontjuk, minden lépésben kiszámoljuk az aktuális blokkra optimális 
kvantáló paramétereit, és átküldjük a dekódernek kiegészítő információként. 

A gyakorlatban inkább a Jayant-kvantáló néven ismert hátra adaptív mód- 
szert használják. Itt minden egyes kvantálási intervallumhoz egy szorzótényezőt 
rendelünk, amely a kvantáló belső (origóhoz közeli) tartományainál 1-nél kisebb, 
míg a külső részeken 1-nél nagyobb. A tényezők az origóra szimmetrikusan he- 
lyezkednek el. Annak függvényében, hogy az aktuálisan kvantált érték melyik 
intervallumba esik, ezen intervallum szorzótényezőjével korrigáljuk a lépésköz 
értékét. Ha a kvantált érték kicsi, akkor finomítjuk a lépésközt, míg nagy értékek 
esetén nagyobb lépésközt fogunk alkalmazni. 


2.5. példa. A 2.8. ábra egy 8 szintű kvantálót ábrázol. Legyenek az egyes inter- 
vallumok szorzótényezői: Mi — Mg — 1.2, M2 — M7 — 1, M3 — M6 — 0.9, M4 — 
M5 — 0.8, a kezdeti lépésköz pedig Ag — 0.5. A kvantálandó sorozat: 0.1, —0.2, 
0.2, 0.1, 0.2, 0.5, 0.9, 1.5, 1.0, 0.9, .... Az első bemeneti adatot a kezdeti 0.5 
lépésközzel az 5. szintre kvantáljuk, a kimenet értéke 0.25 lesz, a hiba 0.15. Így az 
új lépésköz Az — M5Ag — 0.8 - 0.5 — 0.4 lesz. A következő adat a 4. intervallumba 
esik, most a lépésköz 0.4, tehát a kimeneten —0.2 jelenik meg, és a lépésköz új 
értéke Az — M4Ai — 0.32. Így folytatva az eljárást, az eredmény táblázatos for- 
mában a 2.9. ábrán látható. 

Vegyük észre, hogyan alkalmazkodik a kvantáló az inputhoz. Kezdetben a 
bemeneti értékek kicsik, ezért a lépésköz folyamatosan csökken, ezzel egyre jobb 
közelítést biztosítva. Majd nagyobb bemeneti értékek következnek, így a lépésköz 
is növekszik. Megfigyelhetjük, hogy a hiba értéke viszonylag nagy az átmeneti 
szakaszban. 








A kvantálási lépésközt a konkrét megvalósítások természetesen véges pontos- 
sággal ábrázolják, ezért el kell kerülnünk azt a szituációt, hogy a lépésköz fo- 
lyamatos csökkentésével, az nullává váljon. Be kell vezetnünk egy Amin értéket, 
amelynél nem választjuk kisebbnek a lépésközt. Hasonló okok miatt egy Amax is 
szükséges. 

A DPCM egyszerűbb formája, a delta moduláció (DM). Ez egy 1 bites (2 
szintű) kvantálóval rendelkező DPCM. A 2 szintű kvantálóval csak -EA kimeneti 
értékeket állíthatunk elő, vagyis (egy folytonos jel mintavételezésével adódó) két 
minta közötti eltérést csak ezzel reprezentálhatjuk. Amennyiben egy adott beme- 
neti sorozatban a minták közötti különbség nagyon eltér A-tól, a kimeneten egy ál- 
landó torzítás jelentkezik. Ezt gyakoribb mintavételezéssel ellensúlyozhatjuk. A 
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-A/2 A  2A 3A bemenet 
— —3A/2 
—— —5A/2 
ERSSÉS SEBES —7TA/2 


2.8. ábra. Jayant-kvantáló 8 kvantálási szinttel. 


szint szint 





n An bemenet száma értéke hiba új lépésköz 
0 0.5 0.1 5 0.25 0.15 Az — M54Ao 
1 0.4 —0.2 4 —0.2 0.0 Az — M4Ai 
2 0.32 0.2 5 0.16 0.04 A3 — M5A2 
3 0.256 0.1 5 0.128 0.028  — A4 — M5Az 
4 0.2048 —0.3 3 —0.3072 —0.0072 As; — M3A4 
5 0.1843 0.1 5 0.0922 —0.0078 Ag — M5A; 
6 0.1475 0.2 6 0.2212 0.0212 A7— M6As 
7 0.1328 0.5 8 0.4646 —0.0354 Ag — MgA; 
8 0.1594 0.9 8 0.5578 —0.3422 Ag — MgAzg 
9 0.1913 1.5 8 0.6696 —0.8304 Aig — MzAg 
10 0.2296 1.0 8 0.8036 0.1964 Aj — M8A10 
11 0.2755 0.9 8 0.9643 0.0643 A12 — MgA11 


2.9. ábra. A 2.5. példa végeredménye. 
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2.10. ábra. Lineáris delta moduláció. 


DM rendszerekben a legnagyobb előforduló frekvenciának nem csak a kétszere- 
sével, hanem akár a százszorosával is mintavételeznek a torzítás alacsony szinten 
tartása végett (például jó minőségű A/D átalakítókban, ,,1 bites átalakítók"). 

A fix lépésközű kvantálót tartalmazó DM rendszereket lineáris delta modu- 
látornak nevezzük. A 2.10. ábrán megfigyelhetjük, hogy torzítás két okból je- 
lentkezik. Azokon a részeken, ahol a bemenet hozzávetőleg konstans, a kimenet 
oszcillál A-val (granular regions). Ezt a hibát A csökkentésével kompenzálhatjuk. 
Azokban a tartományokban, ahol a bemenet túl gyorsan növekszik vagy csökken, 
a kimenet nem tud lépést tartani (slope overload regions), ezért ezen a A lépés- 
köz növelésével segíthetünk. Látható, hogy a kétféle torzítás egyidejű javítása 
éppen ellentétes feltételeket támaszt A-ra vonatkozóan, ezért fix lépésközzel nem 
oldható meg. 

Ezen segít a lépésköz adaptív megválasztása. A közel konstans tartományok- 
ban kis lépésközt választunk, míg gyors változások esetén növeljük A-t. A beme- 
net lokális tulajdonságához alkalmazkodó rendszerek közül az egyik legkedvel- 
tebb a konstans faktorral alkalmazkodó delta modulátor (constans factor adaptive 
delta modulation, CFDM). A legfontosabb feladat annak megállapítása, hogy ép- 
pen milyen jellegű tartományban vagyunk. A közel állandó részeken a kvantáló 
kimenete majdnem minden mintánál előjelet vált, míg a gyorsan változó interval- 
lumokban a kimenet előjele állandó. A legegyszerűbb esetben csak a megelőző 
mintáig tekintünk vissza a tartomány jellegének eldöntésére. Jelöljük sn-nel a 
delta modulátor n-edik időegységbeli , lépését" és A,-nel az itt érvényes lépés- 
közt (sn — tA,). Ekkor az n3- 1-edik időegységbeli lépésközt a következőképpen 
kapjuk: 





Árns e M:iAn, ha sgns, —sgnsn-i 
nt M2An, ha Sgnsn A Sgn5Sn-1 
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ahol I € My — 5 a 2. A memória növelésével, vagyis például 2 mintára visz- 
szatekintve tovább csökkenthető a torzítás: 


MiAn, ha sgnsn.2 Á sgn5sn-1 A SgnSn 
M2An, ha sgnsn-2 — sgnsn-1 Á SgNSn 
M3An, ha sgnsn.2 Á sgnsn-1 — Sgn5n 
M4An, ha sgnsn-2 — sgnsn-1 — Sgnsn 


Ani Ea 


ahol pl. M1! — 0.4 c M2 —0.9 c M3; —1.5 c M4 — 2.0. 

A beszédkódolásban kívánatos, lassabb alkalmazkodást tesz lehetővé a foly- 
tonosan változó meredekségű delta moduláció (continuously variable slope delta 
modulation, CVSD). Ez csökkenti a közel konstans esetben elkövetett hibát, vi- 
szont növeli a gyors változások esetén bekövetkező hibát. Az adaptív lépésköz 
számítására szolgáló képlet: 


An. szz BA, 1-t OnAo , 





ahol B egy 1-nél alig kisebb konstans, On értéke pedig 1, ha a kvantáló legutóbbi 
K darab kimeneti értékéből J darabnak azonos volt az előjele, egyébként 0. Tehát 
egy K hosszú ablakon keresztül figyeljük a bemenetet, és ebből következtetünk 


2 4 


annak lokális viselkedésére. Jellemző értékek: J — K — 3. 


2.7. Lineáris becslés 


A prediktív kódoló rendszerek, mint például a DPCM, a különbségi sorozat má- 
sodik momentumának és dinamikatartományának csökkentésével érik el céljukat. 
A szórás csökkentése azon múlik, hogy a prediktor mennyire jól tudja megjósolni 


a következő szimbólumot az előzőleg rekonstruált értékek alapján. 
Legyen 6 a különbségi sorozat második momentuma: 


67 —- EC. — pn)?, 


ahol 
Pn — f(án-1,Xn—2, . . . 0) 

a prediktor kimenete. Feladatunk azon f(-) megtalálása, amely minimalizálja 65- 
et. Ez azonban nem ilyen egyszerű. Egyrészt £, — X, -1- an, másrészt gn függ 
dn szórásától, így f(-) megválasztása befolyásolja 63-et, ami pedig hatással van 
a rekonstruált £, sorozatra, ettől pedig függ f(-) megválasztása. A kör bezárult. 
Ez a csatolás (coupling) még egyszerű források esetén is rendkívül bonyolulttá 
teszi az explicit megoldást. Mivel a gyakorlati források közel sem ideálisak, a 
probléma számításigénye kézbentarthatatlanná válik a legtöbb alkalmazásban. 
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Elkerülhetjük ezt a nehézséget finom kvantálás feltételezésével, vagyis feltesz- 
szük, hogy a kvantáló lépésköze olyan kicsi, hogy £, helyett írhatunk X.-et, ezért 


Dn— f(Xn-1,Xn—2, : . . , Xo) 


Tehát, ha megtaláltuk f(-)-et, akkor alkalmazhatjuk a rekonstruált x, értékekre, 
és így közelítőleg megkapjuk pn-et. A 65-et minimalizáló függvény a regressziós 
függvény, vagyis az E(X, I Xn—1, Xn—2, . . . , Xo ) feltételes várható érték. 

Sajnos a feltételes várható érték megtalálásához szükségünk lenne az n-edren- 
dű feltételes valószínűségekre, amelyek általában nem állnak rendelkezésünkre. 


A legjobb megoldás reménytelennek tűnő keresése helyett korlátozzuk vizs- 
gálatainkat a lineáris prediktorfüggvényekre, vagyis 


N 
Dn y diXn—i. 
7—1 


Ezek ugyanis könnyen kiszámíthatóak és tárolhatóak, valamint normális eloszlás 
esetén lineáris lesz a regressziós függvény. N-et a prediktor rendjének nevezzük. 
Élve a finom kvantálás feltételezésével, írhatjuk: 


2 
N 
67—E Le -y ax.) ; (2.25) 
1—1 


ahol a feladatunk a 63-et minimalizáló (a;) sorozat megtalálása. 
63 N változós függvény lokális szélsőértéke létezésének szükséges feltétele, 
hogy a parciális deriváltak 0-k legyenek. Vegyük (2.25) parciális deriváltjait 


rendre aj, j — 1,..., N szerint: 


9 fej N űj 
———— 2 esze ———— — H) ő jazz] 
dij; 607 E FT 6 2 4 17.) 


N 
E [25 e Fi )3 ax.) ) szi 
i—1 
N 
—2E ( ( X4— E aiXnci ] Xn-j ) — 0, 
i—1 


ahol kihasználtuk a várhatóérték-képzés linearitását. Így j — 1, . . . , N-re N egyen- 
letet kapunk, amelyek N ismeretlent tartalmaznak. Ezeket átrendezve kapjuk: 


N 
DF arR(i— j) —R(j), j—1,...,N, 
i—1 
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ahol R(k) a gyengén stacionárius X, kovarianciafüggvénye: 
R(k) — E(X.Xn.4.x) - 


Írjuk fel a most kapott egyenleteinket a könnyebben kezelhető mátrixos alakban: 


Ra —p, 
ahol 
R(0) R(1) R(2) R(N—1) 
R(1) R(0) R(1) R(N — 2) 
R-] RO) R(1) R(0) R(N—3) 
R(N—1) jr a) fő 3) R(0) 

d1 R(1) 

d2 R(2) 

a—] 833 p — R(3) 

daN R(N) 


R kifejezésében felhasználtuk az R(—k) — R(k) tulajdonságot. Ez az egyenlet- 
rendszer az ún. Wiener-Hopf-egyenletrendszer diszkrét alakja. Ha ismerjük az 
(R(k) b), k—O,1,. . . N kovariancia értékeket, akkor meghatározhatjuk a prediktor- 
együtthatókat: 


a — Rp, (2.26) 


amennyiben R" ! létezik. 

A prediktoregyütthatók meghatározására szolgáló (2.26) egyenletet a stacio- 
naritás feltételezésével kaptuk. Ez azonban a gyakorlatban előforduló források 
esetén nem jogos. A stacionaritás legfeljebb csak lokálisan, egy bizonyos jelhosz- 
szon belül igaz. A problémát úgy oldhatjuk meg, ha a prediktort adaptívvá tesz- 
szük a jel lokális viselkedéséhez. Ez történhet előre adaptív (a kódoló bemeneti 
jele alapján) illetve hátra adaptív módszerrel (a kódoló kimenete alapján). 

Előre adaptív esetben a bemenetet blokkokra osztjuk. (Beszédkódolás ese- 
tén a tipikus blokkhossz 16 ms, ami 8000 minta/másodperc esetén 128 mintát 
jelent, míg képtömörítés során általában 8 x 8 pixeles blokkokat használnak.) Ez- 
után kiszámítjuk az empirikus kovariancia együtthatókat minden egyes blokkra, 
amelyekből a (2.26) segítségével kapjuk a prediktoregyütthatókat. A kovariancia 
együtthatók kiszámításakor azzal a feltételezéssel élünk, hogy a minták értéke a 
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blokkon kívül 0. Ezért az /-edik M hosszú blokkra az alábbi közelítést alkalmaz- 


zuk: 
1 1m-—Ikl 


RV (k) — MT B XX. 
i—(1—1) 4-1 
Vk-ra. (RO (k) —R0(—k)) 

Az előre adaptív módszer megköveteli, hogy puffereljük a bemenetet, ezzel 
késleltetést viszünk a rendszerbe, ami például beszédkódolás esetén nem szeren- 
csés. Ugyanis egyetlen kódoló-dekódoló pár esetén még elviselhető a késleltetés 
mértéke, azonban egy telefonkapcsolatban számos DPCM kódoló és dekódoló 
vehet részt (pl. a nagy távolság miatt), s ekkor az eredő késleltetés már jelentős 
lehet. Sőt, itt is, mint előre adaptív kvantálás esetén, kiegészítő információkat kell 
átvinni, hiszen a dekódoló nem ismeri a kódoló bemeneti jelét. 

Hátra adaptív esetben a prediktor alkalmazkodásához a dekóder számára is 
rendelkezésre álló jelet, a kódoló kimenetét használjuk. Először az egyszerűség 
kedvéért vegyünk egy elsőrendű prediktort. Ekkor a jel valódi és becsült értéke 
közötti eltérés négyzete az n-edik időpillanatban: 


d zi (Xn — a1fn-1 


Ezt az a1-ben másodfokú kifejezést (parabolát) kell minimalizálnunk. Gondoljuk 
meg, hogy ha a minimumhelytől pozitív irányban helyezkedik el ai előző értéke, 
akkor ott a derivált pozitív, míg az ellenkező irányban negatív. az új értékét köze- 
líthetjük úgy, hogy a régi értékből levonjuk a derivált konstansszorosát (gradiens 


módszer): 
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Helyettesítsük (2.28)-at (2.27)-be: 
ge — a FO dhXn-1, 


ahol o" — 2. Mivel d,-et csak a kódoló ismeri, használjuk helyette 


ax 


dan — Xn — ag. 1-et: 
1 DÖ x 
art ) — a -k 0 dnXn-1. 


Terjesszük ki ezt az egyenletet az N-edrendű prediktor esetére! Az eltérés hiba- 


négyzete ekkor: 
2 
N 
di si b égi Ha.) . 
i—1 
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Ennek a; szerinti parciális deriválásával kapjuk a j-edik prediktoregyüttható szá- 
mítására szolgáló kifejezést: 


ván ES áj? HO dh£n-j. 


Vektoros formában: 


ahol 


Xn—N1-1 


ÉS N 
dn 7 Xn -— ) diXn-—i. 
i—1 


Az ismertetett eljárás a legkisebb átlagos négyzetek (Least Mean Sguare) 
módszerének rekurzív változata. 


2.8.  Beszédtömörítés 


A beszédtömörítő eljárások területén erőteljes fejlődés volt megfigyelhető az el- 
múlt évtizedekben. A minél alacsonyabb bitsebesség mellett minél jobb minőségű 
hang átvitelének igénye főleg a nyilvános célú távközlés részéről fogalmazódott 
meg. Kezdetben az eddigiekben megismert általános célú eljárásokat alkalmazták. 

Az ismertetésre kerülő megoldásokat a nyilvános távközlőhálózatokban hasz- 
nált inpulzuskód modulációhoz (Pulse Code Modulation, PCM) hasonlítjuk. 
Határozzuk meg ennek bitsebességigényét! A , telefon-minőség" viszonylag kis 
sávszélességgel is beéri. Az analóg 3.4 kHz sávszélességű beszédjelből (némi 
rátartással) másodpercenként 8000 mintát veszünk, és 8 bittel kvantáljuk, így 
8000 - 8 — 64 kbps-ot kapunk. Az 1972-ben megjelent G.711-es távközlési szab- 
vány logaritmikus PCM kódolást használ, azaz kompanderes kvantálót (mint erről 
a 2.2. szakaszban szó volt: 4-law, A-law). 

A beszédtömörítéssel szemben támasztott megnövekedett kommunikációs 
igény elkerülhetetlenné tette egy új eljárás kifejlesztését, amelynek kisebb a bit- 
sebességigénye, de emellett jó minőségű, jól érthető beszédátvitelt tesz lehetővé. 
A kívánalmaknak megfelel az 1984-es G.721 szabvány, amely 32 kbps-os átviteli 
sebességével megduplázta a kiépített vonalakon folytatható beszélgetések számát. 
A G.721 adaptív különbségi kódoláson (ADPCM) alapul. Kihasználja az emberi 
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beszéd különböző időpontokban megfigyelt mintái közötti hosszú- és rövidtávú 
korrelációt (2—20 ms). A kvantálási lépcsők méretét az előző minták alapján vál- 
toztatja. A kódoló késleltetése kisebb mint 2 ms, és számos központon keresztül- 


haladó jel esetén is megfelelő minőséget biztosít. 


A fenti eljárások finomításával jobb tömörítési arány érhető el. Ezek a mód- 
szerek az emberi hangképzés modelljét használják fel: A tüdőből kiáramló levegő 
megrezegteti a hangszálakat, majd a gége, garat, száj- és orrüreg illetve a nyelv 
által képezett változtatható akadályon keresztülhaladva alakul ki végül a hang. A 
hangszálak után lévő hangképző szerveket összefoglalóan hangképző útnak (vocal 
tract) nevezzük. A hangszalagok képzik a zöngét (alaphangot), majd a hangképző 
út modulálja azt. A mesterséges hangképzéshez tehát elő kell állítanunk egy ger- 


24 


jesztő jelet, és ezt kell modulálnunk a hangképző út szerepének megfelelően. 


A kódoló a beszédet szegmensekre osztja, és minden szegmensre meghatá- 


PZN-d 


rozza a gerjesztő jelet, és a hangképző utat modellező szűrő paramétereit. A ger- 
jesztő jel olyan, hogy ezen beállított szűrő kimenete leginkább hasonlítson a tö- 
mörítendő beszédre. A szintetizált beszédtömörítők esetén a gerjesztő jelet nem 
küldjük át, csak néhány paraméterét, és ebből a dekódoló előállítja a megfelelő 
gerjesztő jelet, majd ezzel hajtja meg a saját szűrőbankját, amelynek paramétereit 
a kapott adatoknak megfelelően állította be. 


A tömörítendő beszéd minden szegmensét egy sávszűrő bankon vezetjük ke- 
resztül, amelyet analízis szűrőnek nevezünk. Az analízis szűrő kimenetének ener- 
giáját meghatározott időközönként (általában másodpercenként 50-szer) mintavé- 
telezzük, és átküldjük a dekódolónak. (Az emberi beszéd kb. 20 ms-os egységen 
belül stacionáriusnak tekinthető.) Digitális esetben az energiát közelíthetjük a 
szűrő kimeneti jelének átlagos négyzetösszegével, míg analóg esetben a jel bur- 
kológörbéjének mintavételezésével érhetünk célt. Az energia meghatározásával 
egyidejűleg azt is el kell dönteni, hogy az adott beszédszegmens zöngés vagy 
zöngétlen hangot tartalmaz-e. A zöngés hangok álperiodikus viselkedést mu- 
tatnak, az alapharmonikus frekvenciáját hangmagasságnak hívjuk. A kódoló a 
becsült hangmagasság értékét szintén átküldi a dekódolónak. A zöngétlen han- 
gok zajszerű szerkezetet mutatnak. A szintetizált beszédtömörítést tekinthetjük 
egy olyan vektorkvantálásnak, ahol a kvantálást az egyes szegmensek Fourier- 
transzformáltjainak a terében végezzük. 


PP 4 


A dekódolóban a hangképző szerveket sávszűrő bankkal modellezzük, ez a 


ze PE d 


szintézis szűrő, amely megegyezik az analízis szűrővel. Annak megfelelően, hogy 
zöngés vagy zöngétlen hangot kell-e visszaállítani, a szintézis szűrő bemeneteként 
egy, a hangmagasságnak megfelelő periodikus jelgenerátort vagy egy álzajgene- 
rátort használunk. A jel amplitúdóját a becsült energiának megfelelően állítjuk 


be. 
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A hangképző út egy változtatható méretű rezonátorüregként fogható fel, ezért 
számos rezonanciafrekvencia lehetséges, de nem az összes frekvenciaösszetevő 
egyformán fontos. A rezonanciafrekvenciákat formánsoknak nevezzük. A for- 
máns frekvenciája hangonként eltérő, de férfiak esetén 200-800 Hz, míg nők 
esetén 250-1000 Hz közötti tartományba esik. Ezt a jellemzőt használja fel a 
formáns beszédkódoló, amely meghatározza a formánsok értékének közelítését 
(általában 4 formáns megkülönböztetése elegendő), valamint ezek sávszélessé- 
gét, majd a vevő oldalon a gerjesztő jelet hangolható szűrőkön vezetik keresztül, 
amelyeket a formánsok frekvenciájára és sávszélességére hangolnak. 

Ennyi felvezetés után nézzük meg a konkrét alkalmazásokat! 

Lineáris prediktív kódolás (LPC) esetén egy lineáris szűrőt használunk, mely 
az előző minták alapján próbál optimális becslést adni az aktuális mintára úgy, 
hogy a négyzetes torzítás minimális legyen: 


M 
xn — ) ajxn-i tGen, (2.29) 
i—1 


2 ze 


ahol G a szűrő energiája (gain), en a kvantálandó jel. Az a; együtthatók optimális 
meghatározása a 2.7. szakaszban ismertetett módon történhet. 

Az LPC-nek két változata van. Az egyszerűbb, nem-szintetizált esetben (ez 
még , hagyományos" eljárásnak tekinthető abban az értelemben, hogy nem hasz- 
nálja fel az emberi beszéd modelljét) közvetlenül a különbségi jel mintavételezett 
értékét (€,) küldjük át a vevőnek. Ekkor (2.29)-ben x, helyén a 2.6. szakaszban 
megismert módon a reprodukált £, értékek állnak. 

A fejlettebb módszer a vevőoldalon szintetizált beszédet állít elő, vagyis csak 
a szűrő (a;) paramétereit és a G energiát kell átküldenünk, és ebből generálja 
a vevő a saját szűrőjével a beszédet úgy, hogy az €/ sorozatot helyettesíti egy 
mesterséges gerjesztő jelsorozattal. 

A kódolónak a következő információkat kell átküldenie: zöngés vagy zöngét- 
len-e a hang, a hangmagasság értéke és a hangképző utat modellező szűrő para- 
méterei. Az LPC-10 algoritmus esetén ez a következőképpen néz ki: A zöngés / 
zöngétlen információ 1 bit, a hangmagasságot 60 lehetséges értékre kvantálják 
egy logaritmikus karakterisztikájú kompanderes kvantáló segítségével (6 bit), és 
zöngés esetben 10-edrendű, míg zöngétlen esetben 4-edrendű prediktív szűrőt al- 
kalmaznak, ez 11 (10 a megfelelő együtthatók miatt és 1 az energia számára) 
illetve 5 előre rögzített adatot jelent. A szűrő nagyon érzékeny az 1-hez közeli 
együtthatók hibájára. Mivel az első néhány együttható általában 1-hez közeli, 
ezért a szabvány nemegyenletes kvantálást ír elő az és az számára. Ezt az alábbi 
módon oldják meg: 
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ezután g1 és g2 értékét egy 5 bites egyenletes kvantálóval kvantálják, hasonlóan 
d3 , a4-et 1s. as, . . . , ag-at 4 bites, ag-et 3 bites, míg a19-et 2 bites egyenletes kvan- 
tálóval kvantálják. A zöngétlen esetben fennmaradó 21 bitet hibavédelemre hasz- 
nálják. A G energia értékét a minták négyzetösszegéből gyökvonással határozzák 
meg, és 5 bites, logaritmikus karakterisztikájú kompanderes kvantálóval kvantál- 
ják. A szinkronizációhoz szükséges 1 további bittel együtt ez összesen 54 bitet 
tesz ki. Egy szegmens hossza 22.5 ms, tehát az LPC-10 algoritmus 2.4 kbps 
átvitelét teszi szükségessé. 


A dekódoló zöngés szegmens esetén a szűrő gerjesztőjeleként egy előre tárolt 
hullámformát használ. A hullámforma 40 minta hosszúságú (a mintavételezés 
8 kHz-cel történik), ezért a hangmagasságtól függően csonkolja vagy nullákkal 
tölti ki. Ha a szegmens zöngétlen, akkor a szűrőt egy álvéletlen generátor jelével 
hajtja meg (fehér Gauss-zaj). Az LPC-10 kódoló érthető, de nem túl jó minőséget 
biztosít 2.4 kbps bitsebességen. Az, hogy csak kétféle gerjesztőjelet alkalmaz a 
szűrő bemeneteként, gépi jellegű hangot eredményez. Ez különösen zajos kör- 
nyezet esetén jelent problémát, ugyanis a kódoló a környezeti zaj miatt a zöngés 


szegmenseket is zöngétleneknek fogja nyilvánítani. 


A természetesen hangzó beszéd előállításának egyik legfontosabb összetevője 
a gerjesztőjel, ugyanis az emberi fül különösen érzékeny a hangmagasság hibá- 
jára. Az LPC gyenge pontját küszöbölik ki a szinuszos kódolók. Ezek gerjesztő- 
jelként szinuszos összetevőket használnak. Egy elemi összetevőt három paraméter 
határoz meg: az amplitúdó, a frekvencia és a fázis. Ezek közül, ha a jelet egy line- 
áris szűrőn vezetjük keresztül, a frekvencia nem változik. Mivel a hangképző út 
modellezésére használt szintézis szűrő lineáris, ezért ezen egy szinuszos jelet át- 
vezetve csak az amplitúdó és a fázis változik. Megállapíthatjuk, hogy a gerjesztő 
jel leírásához szükséges paraméterek száma megegyezik a szintetizált beszédet 
reprezentáló paraméterek számával. Így ahelyett, hogy külön-külön kiszámíta- 
nánk és átvinnénk a gerjesztő jel és a hangképző út szűrőjének paramétereit és 
a gerjesztőjelet átvezetnénk a szűrőn, megtehetjük, hogy közvetlenül a beszédet 
állítjuk elő a vevő oldalon a szinuszos összetevőkből. 


A szinuszos kódolók is szegmensekre bontják a beszédet. Amennyiben a vevő 
oldalon egy-egy szegmensen belül a többitől függetlenül szintetizáljuk a beszédet, 
úgy az a határokon nem lesz folytonos, ami jelentősen rontja a minőséget. Ezért 
a szinuszos kódolók különböző interpolációs algoritmusokat használnak a szeg- 
mensek közötti átmenetek finomítására. 


Azonban ez még nem elég, mert hiába közelítjük jól ahangmagasságot, amíg 
a hangképző utat modellező szűrő bemenetére periodikus jelként csak egyetlen 
frekvenciaösszetevőből álló jelet adunk (ahogyan LPC esetén tesszük), addig csak 
zümmögő orrhangot kapunk. Ezt a problémát oldják meg a szintézis általi ana- 
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lízis alapú kódolók, amelyek a gerjesztő jelet egy optimalizáló hurokban hatá- 
rozzák meg. A kódoló egyben dekódolót is tartalmaz, amely a szintézist végzi. 
Az így szintetizált jelből kivonja a bemenő jelet, s az előálló hibajelet minimali- 
zálja. A szintézis általi analízis alapú kódolók egyike a többírekvenciás lineáris 
prediktív kódoló (MultiPulse Linear Predictive Coding, MultiPulse Excitation, 
MPE) eljárás, amely minden szegmensben egyidejűleg több frekvenciaösszetevőt 
használ. A lehetséges frekvenciaösszetevő-mintát egy kódkönyvből választja ki 
olymódon, hogy a valódi és a szintetizált beszédszegmens közötti, az emberi hal- 
lás tulajdonságainak megfelelően súlyozott eltérés minimális legyen (ez egy spe- 
ciális vektorkvantálónak tekinthető). Az MPE 6.4 kbps átviteli sebességgel jó 
minőségű beszédet produkál. Ennek továbbfejlesztett változata a kóddal gerjesz- 
tett lineáris prediktív kódoló (Code Excited Linear Prediction, CELP), ahol a 
lehetséges mintákat tartalmazó (szűk) kódkönyv helyett számos gerjeszetőjelet 
engedünk meg (egy nagyon nagy méretű sztochasztikusan kitöltött kódkönyvet 
használunk). Minden szegmens esetén a kódoló megkeresi azt a gerjesztővektort, 
amelynek alkalmazásával a legtökéletesebb szintetizálás lehetséges. A CELP jó 
minőségű beszédet biztosít 4.8 kbps-os sebességgel, annak árán, hogy kimerítő 
keresést kell végezni egy tipikusan 1024 méretű kódkönyvben. 


A GSM rendszer teljes sebességű kódolása az MPE-hez hasonló módszeren, 
a szabályos impulzus gerjesztésen (Regular Pulse Excitation, RPE) alapul. MPE 
esetén egy rövid perióduson belül (5-15 ms) meghatározott számú (M db) impul- 
zust adunk. Egy adott impulzus amplitúdóját és helyét az előző M darab impulzus 
alapján határozzuk meg. RPE esetén az impulzusok száma szintén rögzített, és az 
MPE-vel szemben ezek helye sem választható szabadon. Ezáltal szuboptimális 
megoldáshoz jutunk, de egyben egyszerűsödik is a kódoló. Az RPE-n alapuló rö- 
vid idejű szintézis szűrőt a GSM rendszer egy hosszú idejű becslő hurokkal (Long 
Term Prediction) egészíti ki. (Ez a közepes bitsebességű kódolók, mint pl. az RPE 
esetén nem létfontosságú, de általában alkalmazzák a minőség növelése érdeké- 
ben.) 8000 minta/s mintavételezési sebesség mellett 13 kbps-os kódsebességet 
biztosít, ugyanis 20 ms-onként 260 bitnyi paramétert (tömörített információt) állít 
elő. 


A GSM félsebességű kódolása a CELP családba tartozó vektorösszeggel ger- 
jesztett lineáris prediktív kódoló (Vector-Sum Excited Linear Prediction, 
VSELP) megoldáson alapul. A gerjesztésre a kódkönyvből származó értékek 
szolgálnak, melyek részben rögzítettek, részben adaptív jellegűek. A zöngés jel- 
leg mértékének vizsgálata alapján a kódoló elrendezése négyféle lehet. A 0 kate- 
gória jelenti a zöngétlen, az 1—3 pedig az egyre növekvő mértékben zöngés jellegű 
beszédszegmenst. A struktúra 5 ms-os ún. alkeretenként változhat. A kódkönyv- 
ben kimerítő keresést alkalmaznak az alkeretenkénti gerjesztősorozat meghatáro- 
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zásához, és a minimális hibajel teljesítményt adó gerjesztő kódot választják ki. Ha 
a beszéd zöngés, akkor hosszú idejű becslőt is alkalmaznak. (Ez a kis bitsebes- 
ségű kódolóknál, mint pl. a VSELP nélkülözhetetlen.) A félsebességű kódoló a 
teljes sebességű változat 260 bitje helyett szegmensenként csak 112 bitet használ, 
ez 5.6 kbps-nak felel meg. 


2.9. .  Hangtömörítés 


2 


Az előző szakaszban az emberi beszéd minél gazdaságosabb, minél kisebb bit- 
sebességet igénylő átvitelére koncentráltunk. Azonban a továbbítandó vagy táro- 
landó hanginformáció természetesen nemcsak beszéd lehet, hanem például zene 
is. Az ezen a területen használható módszereket tekintjük át az alábbiakban. 

A hangtömörítésben mércének számító CD-minőség azt jelenti, hogy 44100 
Hz-cel mintavételezünk. Ez a mintavételi tétel értelmében a legfeljebb 22050 
Hz frekvenciájú hangok visszaállítását teszi lehetővé (valójában mintavételezés 
előtt a 20 kHz-es sávra szűrnek). A mintákat 16 bites kvantálóval kvantáljuk. 
Ez 44100 - 16-2 — 1400 kbps átviteli sebességet igényel (a 2-es szorzó a sztereó 
átvitel 2 külön csatornája miatt van). 

A veszteségmentes tömörítési módok (pl. Huffman-kódolás, LZW) itt nem 
igazán hatékonyak, az eredmény általában az eredeti méretének 90 90-a körül van. 

A modern, hangtömörítésre kifejlesztett eljárások az emberi hallás sajátossá- 
gait kihasználva érnek el az általános célú módszereknél jobb tömörítési arányt, 
így amellett, hogy veszteséges eljárások, a veszteség mértéke nem is egyenletes 
sem a frekvencia-, sem az időtartományban. Mivel itt a közel tökéletes hang visz- 
szaállítása a cél, ezért a hangtömörítésben nem megengedett a szintetizálás. 

Az emberi hallás tartománya 20 Hz — 20 kHz, a legnagyobb érzékenysége 
2 és 4 kHz között van, felbontása (a kvantálási lépcső) frekvenciafüggő. Ebből 
következően két azonos intenzitású, de különböző frekvenciájú hang különböző 
hangosságérzetet kelt a hallgatóban, és azokban a tartományokban, amelyekben 
fülünk kevésbé érzékeny, jobban elviseljük a torzítást. Hallásunkra jellemző két 
elfedési jelenség. Az egyik a frekvenciatartománybeli elfedés, melynek lényege, 
hogy egy adott frekvenciájú, nagy intenzitású hang (maszkoló hang) a vele egy 
időben szóló és közeli frekvencián lévő kisebb intenzitású hangokat elfedi, vagyis 
azok nem hallhatóak. A másik az időtartománybeli elfedés: egy adott frekvenci- 
ájú nagy intenzitású hang a közeli frekvencián lévő kisebb intenzitású hangokat 
nemcsak akkor fedi el, amikor együtt szólnak, hanem kis ideig még a nagy inten- 
zitású hang bekapcsolása előtt (kb. 2 ms-ig) vagy kikapcsolása után (kb. 15 ms-ig) 
sem halljuk a kisebb intenzitásúakat. 


Mivel az emberi hallás legjobban a frekvenciatartományban modellezhető, 
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ezért a hangtömörítő eljárások frekvenciatartománybeli analízissel dolgoznak. A 
fentiek alapján nem minden frekvenciaösszetevőt kell átvinni, és a kódolandókat 
sem azonos pontossággal kell kvantálni. 


Az eredetileg mozgóképtömörítésre kifejlesztett MPEG-1 szabvány hangtö- 
mörítő része jól kihasználja az emberi hallás sajátosságait. A hangtömörítésre 
három hasonló eljárást definiál, és ezeket Layer 1,2,3-nak nevezi. 


PE d 


Az egyszerűbb Layer 1! és 2 eljárás analízis szűrőbankja a bemeneti jelet 32 
részsávba képezi le, melyek szélessége egyenként a mintavételi frekvencia 64-ed 
része. A mintavételezés 32, 44.1 vagy 48 kHz-cel történhet. Ezután részsávonként 
egy transzformációs kódolás következik. A maszkoló és a maszkolt hang(ok) elté- 
rését (Signal-to-Mask Ratio, SMR) Layer 1 esetén 512 pontos, míg Layer 2 esetén 
1024 pontos gyors Fourier-transzformációval (FFT) számítja. Mindkét módszer 
12 mintát (keret) kódol együtt minden sávban, de a Layer 2 a megelőző és a kö- 
vető 12 mintát is megvizsgálja az időbeli maszkoláshoz, valamint a skálafaktoro- 
kat is hatékonyabban kódolja. Dinamikus bitallokációval kiválasztja a lehetséges 
15 kvantáló egyikét minden egyes részsáv számára úgy, hogy az a skálafaktor (a 
legnagyobb amplitúdójú jel) és az SMR közötti bitmegosztást tekintve optimá- 
lis legyen. A CD-minőségű hang átviteléhez az MPEG-1 Layer 1 eljárásnak 384 
kbit/s-ra, míg a Layer 2-nek 256 kbit/s-ra van szüksége. (2.11. ábra) 


A napjainkban oly nagy népszerűségnek örvendő MPEG-1 Layer 3 eljárás a 
Layer 1,2-höz képest lényeges, a hangminőséget javító eltéréseket tartalmaz. A 
32 részsáv mindegyikét további 6 vagy 18 frekvenciaösszetevőre bontja módosí- 
tott diszkrét koszinusztranszformáció (MDCT) felhasználásával. Így a 18 pontos 
MDCT alkalmazása 750/18 — 41.67 Hz frekvenciafelbontást biztosít. A frekven- 
ciakomponensekre ezután egy nemegyenletes kvantálót alkalmaz, majd a kime- 
netet a lehetséges 18 Huffman-kódtábla egyikével kódolja. Az eljárás tartalmaz 
egy iterációt a bitsebesség és az elfedési kritérium kielégítésének biztosítására. 
Ennek az adja meg a lehetőségét, hogy míg rögzített bitsebesség mellett minden 
keret azonos számú bájtot tartalmaz, addig a Layer 3 esetében meg lehet azt tenni, 
hogy az egyik keretet kevésbé töltjük fel (ha nincs rá igény), és a maradék helyre 
a következő keret bitjeit tesszük. Így egy keret adatai adott határokon belül át- 
csúszhatnak a szomszédos keretekbe. (2.12. ábra) 


Az MPEG szabványok csak a dekódolót szabványosítják, a kódolót nem. Per- 
sze az adott dekódoló-részegységhez sok esetben létezik optimális kódolórész (pl. 
IDCT a dekódolóban —: DCT a kódolóban, ismertek a kódpontok a dekódolóban 
— kiszámíthatóak a kvantálási tartományok a kódolóban). Bizonyos esetekben 
(pl. az emberi hallás modelljének felhasználása vagy a bitallokáció esetén) már 
nagy a szabadsági fok, ebből következnek a különböző MPEG kódolók közötti 
minőségi eltérések. 
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2.11. ábra. Az MPEG-1 Layer 1,2 hangtömörítő eljárás tömbvázlata. 
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2.12. ábra. Az MPEG-1 Layer 3 hangtömörítő eljárás tömbvázlata. 
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2.10.  Kép- és videotömörítés 


Kép- és videotömörítés esetén alkalmazhatunk egyértelműen dekódolható (vesz- 
teségmentes), vagy hűségkritériumon alapuló (veszteséges) módszereket. A vesz- 
teséges módszerek a veszteségmenteseknél egyes esetekben akár egy nagyság- 
renddel is jobban tömöríthetnek, észrevehető minőségromlás nélkül. Amennyiben 
a minőségi megkötések nem nagyon szigorúak, még ennél is többet nyerhetünk 
a veszteséges módszerek alkalmazásával. Ahhoz, hogy a minőségromlás és a tö- 
mörítés mértéke között meg tudjuk találni az egyensúlyt, szükségünk van e két 
jellemző kvantitatív mérésére. 

A tömörítés mértékének megállapításához mérnünk kell a tömörítetlen és a 
tömörített információ méretét, majd ezek hányadosát kell vennünk. A tömörí- 
tett információ a legtöbbször bitfolyamként jelenik meg, ennek mérete a benne 
levő bitek száma. A tömörítetlen információ mennyiségének mérése nehézsé- 
gekbe ütközhet folytonos értékkészlet vagy értelmezési tartomány esetén. Ilyen- 
kor az információ mennyiségét vehetjük a kódoló bementetén megjelenő jel — 
ami általában egy bitfolyam — méretének. Célszerűen ez a bitfolyam az ere- 
deti jellel azonos vizuális élményt adó, de már mintavételezett és kvantálással 
véges értékkészletűvé alakított jel bináris ábrázolása. A tömörítetlen informá- 
ció mennyiségének becsléséhez kulcsfontosságú a megfelelő mintavételezés és 
kvantálás kiválasztása. Ezt a legtöbb esetben szabványok határozzák meg. Ilyen 
szabványokkal találkozhattunk már a hangtömörítésnél is: a CD-minőségű hang 
a maga 44.1 kHz-es mintavételezésével és 16 bites lineáris kvantálásával pon- 
tosan ilyen volt. Képtömörítésnél a felbontást és a színmélységet kell meghatá- 
roznunk. Videotömörítés esetén emellett meg kell adnunk a képfrekvenciát is. 
Képtömöríésnél gyakorlatilag bármilyen felbontás használható, míg videotömörí- 
tésnél a nemzetközi televíziós szabványokhoz alkalmazkodva 720 x 480 (NISO), 
768 x 576 (PAL) a szokásos felbontás. Az ezekhez tartozó képfrissítési frekven- 
ciák pedig 29.97 Hz illetve 25 Hz. A színtérbeli kvantálást a színmélység, vagyis 
az egy képpontra jutó bitek száma jellemzi. Általánosan alkalmazott a 8 és a 24 
bites színmélység. 

A hűségkritériummal való kódolás csakis akkor értelmes, ha azt úgy határoz- 
zuk meg, hogy egy adott minőséget garantáljon. Sajnos csak szubjektív értékelé- 
sekre támaszkodhatunk egy adott kép vagy video minőségének megítélése során. 
Egy veszteséges tömörítési módszer értékelése céljából úgy járhatunk el, hogy bi- 
zonyos tesztadatokon végrehajtjuk az adott tömörítést, majd a tömörítés inverzét, 
és az így visszakapott kép vagy video minőségét egy tesztcsoporttal értékeltet- 
jük. Ha a teszt lefolytatása során elég körültekintően járunk el, akkor viszonylag 
objektív eredményeket kaphatunk az adott módszer minőségéről. Például egy 
lehetséges eljárás, ha a vizsgálni kívánt tömörítést jól definiált egyéb tömöríté- 
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sekkel hasonlíttatjuk össze. Hűségkritériumnak tekinthetjük azt, hogy sikerült-e 
egy adott standard módszernél jobb minőséget elérni. Megfelelően standardizált 
teszteket ilyen értelemben tekinthetünk hűségkritérumnak. 


Az emberi látás 


A veszteséges kép és videotömörítési módszereket az emberi látásról meglevő 
ismereteket felhasználva alakították ki. Az információmennyiség csökkentése ér- 
dekében a kép azon részleteit kódoljuk kis pontossággal, amelyekre a szemünk 
kevéssé érzékeny, és azokat kódoljuk majdnem eredeti minőségben, amelyekre a 
szemünk igen érzékeny. 

A színek és a fényesség érzékeléséért a szemben található fényérzékelő re- 
ceptorok, a csapok és a pálcikák a felelősek. A pálcikák azonban csak a látás 
perifériális tartományában illetve igen kis fényességek esetén játszanak jelentős 
szerepet az érzékelésben, jelenlétüktől ezért most eltekinthetünk. Háromféle kü- 
lönböző spektrális érzékenységű csap található a szemünkben. Ezek a csapok az 
őket érő fényre lineárisan reagálnak. Spektrális érzékenységüket jelöljük rendre 
5(A)-val, m(M-val és I(A)-val. Ezek a függvények a látható spektrumtartomá- 
nyon (360 nm-830 nm) kívül 0 értéket, belül pedig nemnegatív értéket vesznek 
fel. 5(A) csúcsa a kisebb hullámhosszak tartományában található, m(A) csúcsa a 
közepes hullámhosszaknál, míg I(A) csúcsa a nagyobb hullámhosszaknál. Ezért 
kapták nevüket az angol short, medium és long szavak kezdőbetűiből. 

Egy L(A) spektrális energiasűrűséggel rendelkező fénysugár által kiváltott in- 
ger az alábbi vektorral jellemezhető: 


S sÍÁ 
Mm] - H m() ILJA 
L IA) 


Az integrálást itt a látható spektrumtartományon kell elvégezni. Természetesen 
L(A) semmilyen A-ra sem lehet negatív, ugyanis a negatív spektrális energiasűrű- 
ségnek nincs fizikai értelme. Így nyilvánvalóan S, M és L értéke is nemnegatív. 

Ebből az ingerhármasból alakul ki idegrendszerünkben nemlineáris feldolgo- 
zás során a fényesség- és színérzet. Fontos következménye ennek, hogy két külön- 
böző spektrummal rendelkező fényt nem tudunk megkülönböztetni, ha a hozzájuk 
tartozó S, M és L értékek megegyeznek. Ezt a jelenséget nevezzük metamer szín- 
érzetnek, és az azonos S, M és L ingert kiváltó (vagyis azonos fényesség- és szín- 
érzetet keltő, emberi szem által megkülönböztethetetlen) spektrumokat nevezzük 
metamer színeknek. 

Mivel szemünk érzékenysége a fényességre jóval nagyobb, mint a színre, ér- 
demes ezeket az adatokat elkülöníteni egymástól. Ehhez végezzünk az ingerekből 
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2.13. ábra. Az x(A), y(A) és z(A) spektrális súlyfüggvények. 


álló vektoron egy lineáris transzformációt: 
(Xx Y 27 -M(S M LY 


Ebben a transzformált térben Y a fényességérzetet, míg X és Z a színérzetet írja 
le. Természetesen egy L(A) spektrumú fény (X, Y, Z) koordinátái egy lépésben (S, 
M és L kiszámítása nélkül) is számíthatóak: 


X (A) 
ris 7 50) IL da 
Z z(A) 


Az integrálást itt is a látható spektrumra kell elvégeznünk, és az 


ri s SZA3AT ta 13 SZASAT 
CA) FO) z0)) -MGO) ma) I()) 
súlyfüggvényeket kell alkalmaznunk. x(A)-t, y(d)-t és z(A)-t ábrázoltuk a 2.13. 
ábrán. Fontos tény, hogy M-et úgy választották, hogy minden nemnegatív érték- 
készletű L(A)-hoz tartozó X, Y és Z értékek nemnegatívak legyenek. 

A gyakorlatban a fényesség leírására Y megfelelő, a színérzetet pedig az x — 
XITEZ SY —xg -p sz koordinátákkal szokták megadni. (Vagyis x és y az adott 
spektrumhoz tartozó (X,Y,Z) vektor egyenese és az X.Y 37 — 1 sík döfés- 
pontjának X és Y koordinátája.) Ezáltal tehát egy tetszőleges L(A) spektrumhoz 
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rendeltünk (Y, x,y) koordinátákat. Természetesen egy adott (Y, x,y) koordináta- 
hármas több különböző spektrumhoz is hozzá lett rendelve. 

Ha csak a színérzettel foglalkozunk, elegendő az (x,y) koordinátapárossal szá- 
molni. Ennek az (x,y) színkoordináta-rendszernek az az előnye, hogy két tetsző- 
leges spektrumból additívan kikeverhető spektrumok a két kiindulási spektrum 
által meghatározott szakaszon fekszenek. Matematikailag, ha L1 (A) spektrumhoz 
az (xi,y1) pont tartozik, és L2(A)-hoz pedig (x2,y2), akkor tetszőleges nemne- 
gatív v-re és u-re az L(A) — uL1(A) 4 VL2 (A) spektrumhoz tartozó (x,y) pont az 
(xi, y1)-et és (x2,y2)-t összekötő szakaszon fekszik. Sőt, általánosságban is ki- 
mondható, hogy az L;(A) spektrumok nemnegatív együtthatós lineárkombináció- 
ihoz (Eu L:(A) u 2 0) rendelt (x,y) koordináták az L;(A) spektrumokhoz rendelt 


[4 
(xi, Yi) pontok konvex burkán belül fekszenek. 

Az egyetlen spektrális összetevőt tartalmazó (L(A) — cö(A — ho)) spektru- 
mokat monokromatikus spektrumoknak nevezzük. A monokromatikus spektru- 
mokhoz tartozó pontok egy görbét adnak az (x,y) színkoordináta-rendszerben. A 
görbe és a két végpontját összekötő szakasz által határolt területet nevezzük szín- 
patkónak. Ezt tüntettük fel a 2.14. ábrán. 

Mivel tetszőleges spektrum felírható monokromatikus spektrumok integrálja- 
ként, a fentiek értelmében tetszőleges valódi spektrumhoz tartozó (x,y) koordiná- 
ták a színpatkó területén helyezkednek el. (Ugyanis ez a tartomány a monokroma- 
tikus spektrumok pontjainak konvex burka.) Másképpen fogalmazva: nemnegatív 
L(2)-ból számolt (x,y) értékek nem eshetnek a színpatkón kívülre. 

A ma használt képernyők legnagyobb része három különböző színű foszfor 
által kibocsátott fény additív keverésével dolgozik. A foszforokat különböző mér- 
tékben gerjesztve különböző fényesség- és színérzetek kelthetőek. Ha a fenti 
(x,y) koordinátarendszerben bejelöljük a felhasznált foszforok által kibocsátott 
fény spektrumához tartozó pontokat, akkor egy háromszöget kapunk, mely a kép- 
ernyő által kelthető színérzetek tartományát határolja. Az ezen tartományon kí- 
vül eső (x,y) koordinátákhoz tartozó színérzetek keltésére az adott képernyő nem 
alkalmas. Példaként a 2.14. ábrán feltűntettük a HDTV szabványban szereplő 
foszforoknak megfelelő pontokat, és a velük megjeleníthető színek tartományát. 

Ha a fent bemutatott módon működő képernyővel jelenítünk meg, érdemes 
a fényességeket és színeket nem (Y,x,y) koordinátákkal, hanem olyan koordi- 
nátákkal megadni, amelyek azt mutatják, hogy a három alapszínt milyen arány- 
ban kell keverni a kívánt színhatás eléréséhez. Mivel a megjelenítők nemlineáris 
karakterisztikával rendelkeznek, a megfelelő nemlineáris előtorzítással (gamma- 
korrekció) kapott (R", G", B") értékeket szokták használni. Ezek értéktartománya 
a 0 és 255 közötti egész számokból áll. Ilyen színkezelés esetén 22" különböző 
színt tudunk reprodukálni, ami a legtöbb esetben kielégítő. Az (R", G", B") színko- 
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2.14. ábra. Az (x,y) színkoordináta-rendszer és a HDTV képernyőkben használt 
foszforok által megjeleníthető tartomány. 


ordináták csak a három alapszín által határolt háromszögön belüli színeket tudják 
leírni, de ha úgyis csak ezt a tartományt tudjuk megjeleníteni, akkor nincs is ér- 
telme az ezen tartományon kívüli színek leírásának. 


Egyes esetekben el kell választanunk a fényesség- és a színinformációt. Erre 
természetesen alkalmasak lennének az (Y, x,y) koordináták, viszont ezek valós ér- 
tékűek, nehézkes velük számolni és nehéz őket hatékonyan tömöríteni. További 
hátrány, hogy bár Y a fényességérzetet jellemzi, szemünk nem egyenletesen ér- 
zékeny az Y koordinátában: például az Y — 0.1 és az Y — 0.2 közötti fényesség- 
különbséget jóval nagyobbnak látjuk, mint az Y — 0.7 és Y — 0.8 közötti különb- 
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séget. Az (R", G", B") értékekből affin transzformációval kaphatóak az (Y", Cp, C,) 
színkoordináták. Y"-t luminanciának nevezzük, és a fényességérzetet írja le, C-t 
és C,-t krominanciának nevezzük, ezek a színérzetet írják le. 


Y! 16 65.738 — 129.057 25.064 
Cs)— 1128] zzz [—37.945 —74.494 112.439 (RG B) 
C, 128 112.439  —94.154 —18.285 


Ennek a színkoordináta-rendszernek az Y" együtthatójában már többé-kevésbé ál- 
landó a szemünk érzékenysége. További előny, hogy ezek az értékek is 0 és 255 
közötti egész számok, és belőlük az (R", G", B") számértékek egyszerűen előállít- 
hatóak. Hátrányuk viszont, hogy csak a teljes színpatkó egy háromszög alakú 
tartományát tudjuk velük reprezentálni. 

Most foglaljuk össze, hogy az emberi színérzékelésről szerzett információin- 
kat hogyan használhatjuk fel kép- és videotömörítés esetén. Bizonyos esetekben, 
amikor a cél nem a színérzet tárolása, hanem egyéb későbbi feldolgozás (például 
csillagászati felvételek esetén), akkor szükséges lehet a beérkező fény spektrumá- 
nak mintavételezett formáját tárolni. Ha azonban csak a vizuális élmény vissza- 
adása a célunk, akkor a metamer színérzet miatt képpontonként elegendő mind- 
össze három valós számértéket (pl. (Y,x,y)) tárolni. Ha ezen felül azt is tudjuk, 
hogy a képet a későbbiekben vörös, zöld és kék foszfort alkalmazó megjelenítőn 
akarjuk rekonstruálni, vagy legalábbis megelégszünk az ezen megjelenítők által 
előállítható színtartománnyal és 2" szín megkülönböztetésével, akkor elegendő 
csak három nyolcbites értéket (pl. (R", G", B")) tárolni. (Nyomdatechnika esetén 
például előfordulhat, hogy ez a tárolás nem kielégítő.) Veszteséges tömörítés ese- 
tén felhasználhatjuk azt is, hogy a fényességre jobban érzékeny a szemünk, mint 
a színre. Ilyenkor fogjuk az (Y", C,, C,) számhármast használni, és nagyobb torzí- 
tást engedünk meg C; és C,. értékére, mint Y" értékére. 

Szemünknek sok egyéb olyan tulajdonsága is van, amit kép- és videotömö- 
rítéskor kihasználhatunk. Megfigyelhetjük, hogy a nagyobb térbeli frekvenci- 
ájú összetevőkre kevésbé érzékeny a szemünk mint az alacsonyabb frekvenciá- 
júakra. Például egy halvány sűrű mintázatot sokkal kevésbé veszünk észre, mint 
egy ugyanolyan halvány, de ritkás mintát. Tömörítésnél, ha a kép kétdimenziós 
Fourier-transzformáltját vesszük, akkor ebben a magasabb frekvenciás összetevők 
torzítása nem okoz észrevehető hibát, míg az alacsonyabb frekvenciájú összetevők 
torzítása igen feltűnő a képen. Pontosabban, a kétdimenziós Fourier-transzformált 
frekvenciatartományban a szem érzékenysége a két frekvencia összegének növe- 
kedésével monoton csökken. 

Kísérleti tény továbbá, hogy a térbeli és időbeli frekvenciák érzékelése össze- 
függ: egy rövid ideig látott képen csak az igen kicsi térbeli frekvenciájú össze- 


tevőket figyeljük meg, a finomabb mintázatokat csak hosszabb ideig látott képen 
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vagyunk képesek érzékelni. Veszteséges videotömörítésnél ennek megfelelően 
megengedjük, hogy egy hirtelen megjelenő képrészletnek az első néhány képkoc- 
kán csak az alacsonyabb térbeli frekvenciás összetevői jelenjenek meg. A maga- 
sabb frekvenciás összetevőket elég csak ezután megjeleníteni. 


Graphics Interchange Format (GIF) 


A GIF formátumot a Compuserve Information Service foglalta szabványba. 
Grafikus képek veszteségmentes tömörítésére lehet használni. Az algoritmus 
LZW alapokon működik. Lényegében egy dinamikusan növekvő szótárral dol- 
gozó megoldás. 

A GIF formátum a képpontok színét úgynevezett indexelt formában tárolja. 
Amikor minden képpont színét a fentebb bemutatott színkoordináta-rendszerek 
valamelyikében adjuk meg, folytonos tónusú tárolásról beszélünk. Megtehetjük 
azonban, hogy a képen használt színek valamilyen leírását egy palettába gyűjtjük 
ki, és a képpontok megadásakor a színekre a palettabeli indexükkel hivatkozunk. 
Ezt nevezzük indexelt tárolásnak. 


Ilyen tárolással igen nagy tömörítést érhetünk el. Gondoljuk meg, hogy ha egy 
képet az (R", G", B") színkoordinátákkal, koordinátánként 8—8 bitet felhasználva 
folytonos tónusúan tárolunk, akkor minden képponthoz 24 bitet kell megadnunk. 
Ha ugyanezt a képet egy 256 színű palettával indexelten tároljuk, akkor a palettán 
kívül képpontonként csak egy 8 bites indexet kell megadnunk. Ez — amennyiben 
a képméret nem túl kicsi — körülbelül 1 : 3 tömörítést jelent. 


Természetesen bármilyen kép tárolható indexelt formában, legfeljebb igen 
nagy méretű paletta szükséges. Az indexelt tárolás lényege viszont épp a viszony- 
lag kis méretű paletta alkalmazása. A képek folytonos tónusú tárolással kerül- 
nek a tömörítőalgoritmusok bemenetére, gondoljunk például szkennelt fényképre 
vagy digitalizált videojelre. (Ez alól csak a számítógépes grafikák alkotnak néha 
kivételt, ugyanis ezek lehet, hogy azonnal indexelt formában készülnek.) Ezért 
szükséges lehet, hogy egy folytonos tónusú képet indexeltté alakítsunk. Ennek 
során minél kisebb palettaméretet szeretnénk elérni, annál többet kell az eredeti 
kép színei közül másikkal helyettesíteni. Felfoghatjuk ezt úgy is, hogy az indexelt 
tárolású formává való átalakítás egy vektorkvantálás a színtérben. Az optimális 
(tehát a lehető legkevésbé látható torzulást okozó) paletta (vagyis az optimális 
kvantálási vektorok) kiválasztására speciális — az emberi színérzékelés tulajdon- 
ságait kihasználó — algoritmusok állnak rendelkezésre. 

A GIF formátumban a paletta mérete általában 256, de bármely kisebb 2 hat- 
vány használata is megengedett. A palettában a színek megadása az (R", G", B") 
színkoordinátákkal történik. A paletta tömörítésének mikéntjével nem foglalko- 
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zunk. A képpontokat a GIF tömörítés sorfolytonosan tapogatja le, és a sorozatot 
LZW algoritmussal tömöríti. 


A tömörített kép első bájtjának értéke a képpontonkénti bitszám (b). Ez ha- 
tározza meg a palettaméretet: 29. Az LZW szótár kezdeti mérete 291!, tehát 
minden kódszó b 3-1 bites. Az első néhány képpont szempontjából (amíg nincs a 
képpontok sorozatában ismétlődés) ez azt jelenti, hogy képpontonként egy plusz 
bit képződik, hisz a b bites képpont b -- 1 biten lesz tárolva. Közben azonban 
épül az LZW szótár, és ha a képpontértékek sorozatában valahol ismétlődés van, 
azt az LZW azonnal kihasználja. Ha a 2t! méretű szótár betelt (ezt a pillanatot 
természetesen a kitömörítő algoritmus is meg tudja állapítani), a szótár méretét az 
algoritmus megduplázza, és ettől kezdve b -- 2 bites kódszavakkal dolgozik. Ha 
ez a szótár is betelik, akkor ismét duplázódik a méret, amíg el nem éri a 4096 be- 
jegyzést. Innentől már nem növekszik tovább a szótár, hanem az eddig elkészült 
szótárat fogja a továbbiakban statikus szótárként használni az algoritmus. 


A GIF formátum nagyon elterjedt, leginkább kis ikonok, ábrák tömörítésére 
alkalmazzák, ugyanis ezeket képes igen jól tömöríteni. Ennek egyik oka, hogy 
az ikonok és ábrák sok esetben nagy kiterjedésű, egyszínű területeket tartalmaz- 
nak, és ezek a sorfolytonos letapogatással hosszú egyszínű sorozatokként jelennek 
meg. A hosszú sorozatok az LZW szótárban egy kódszóval reprezentálhatók, így 
igen hatékony a tömörítés. Ugyancsak jellegzetessége az ilyen képeknek, hogy 
ismétlődő részleteket tartalmaznak, és ezek megintcsak kedveznek az LZW al- 
goritmusnak. Azonban például fotók esetén az egyszínű területek igen ritkák, és 
méretük is viszonylag kicsi. Ennek eredményeképpen a GIF tömörítési aránya 
ilyen képnél (1 : 1.2 — 1.7) elmarad sok más, viszonylag egyszerű módszer mö- 
gött. (Például, ha predikcióként az előző képpont értékét használjuk, és a kapott 
különbségi sorozatot adaptív aritmetikai kódolóval (tehát gyakorlatilag emléke- 
zetnélküli forrás entrópiájának megfelelő bitsebességgel) tömörítjük, akkor a tö- 
mörítési arány 1 : 1.3 — 2.2 lesz.) 


A különbség másik oka a színkezelésben keresendő. Az ikonok és ábrák álta- 
lában viszonylag kevés színt tartalmaznak, ezért igen előnyös az indexelt tárolá- 
suk. Egy olyan tömörítés, amely nem tud indexelt képeket tömöríteni, egy ilyen 
ábrát kénytelen lenne folytonos tónusúvá alakítani a tömörítés előtt. Így kétszer- 
háromszor akkora adatmennyiséget kellene, hogy tömörítsen, mint a GIF, amely 
közvetlenül az indexelt formával képes dolgozni. Sok módszer azért nem tud köz- 
vetlenül indexelt képeken dolgozni, mert a szomszédos képpontok értékeinek kis 
különbségére alapoz. Mivel folytonos tónusú tárolásnál a szomszédos képpontok- 
ban tárolt értékek a színkoordináták, ez a feltételezés helyes, és általában teljesül 
is. Indexelt tárolás esetén azonban a képpontokban tárolt értékek a palettaindexek, 
és ezek tetszőlegesen távoliak lehetnek (csak a nekik megfelelő palettabeli szín- 
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koordináták értékei vannak egymáshoz közel). Fokozottan jelentkezik ez akkor, 
ha valamilyen palettaoptimalizáló eljárást alkalmaztunk. Eléggé jól látható, hogy 
a GIF-nek miért nem probléma ez: a GIF ismétlődő mintázatokat keres, és ilyen 
szempontból teljesen mindegy, hogy a közeli képpontok értékei megközelítőleg 
egyenlőek-e. Mindössze az számít, hogy vannak-e ismétlődések. Így már érthető, 
hogy miért is olyan hatásos módszer a GIF számítógépes ábrák tömörítésénél. 


Joint Photographic Experts Group (JPEG) 


A JPEG a képtömötgítés civil világában szinte egyeduralkodó a veszteséges tö- 
mörítések területén. Az egész szabványcsomagot a Joint Photographic Experts 
Group (ISO/IEC JTC 1 / SC 29 / WG 1) dolgozta ki folytonos tónusú képek tö- 
mörítésére. Valójában a JPEG szabványcsomag támogat veszteséges és veszteség- 
mentes képtömörítést is, bár tény, hogy a gyakorlatban szinte kizárólag az elsőt 
használják. Mindezek ellenére a prediktív kódolás jó példája a veszteségmen- 
tes JPEG, ezért az alábbiakban ezt is bemutatjuk, továbbá részletesen tárgyaljuk a 
veszteséges JPEG egy egyszerű változatát, a baseline JPEG-et. 

A veszteségmentes JPEG képtömörítés alapja a predikciós kódolás. Predikci- 
óra az éppen tömörítésre kerülő képpont környezetét használjuk fel. Mivel a kép- 
pontok letapogatása itt is sorfolytonosan történik, az adott képponttól balra vagy 
felfelé eső képpontok értékei azok, amelyek a dekódoló rendelkezésére állnak az 
adott képpont értékének visszaállításakor, így a kódoló is csak ezeket használja fel 
a predikcióhoz. Nyolcféle predikciós séma létezik, és ezek közül egy adott kép 
tömörítéséhez bármelyik használható, de egy képen belül végig ugyanaz a séma 
érvényes. Jelölje X; j az (i, j) koorinátájú képpont értékét, és X j az (i, j) koor- 
dinátájú képpont becsült értékét. Az (i, j) koordinátájú képpont becsült értéke az 
egyes predikciós sémákban: 
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2.15. ábra. Veszteséges baseline JPEG tömörítés. 


Látható, hogy az első lehetőség maga a predikciómentes tömörítés. Megfi- 
gyelhető, hogy az összes többi predikciós séma mellett az egyszínű területeken a 
predikciós hiba 0, azaz £ j—Xj. 

A predikciós hibát adaptív aritmetikai kódolással ajánlott tömöríteni. Javít- 
ható a tömörítés mértéke, ha a képet blokkokra osztjuk, és minden blokkra külön 
adjuk meg a használni kívánt predikciós sémát. 

A veszteséges baseline JPEG tömörítés algoritmusa a 2.15. ábrán látható. A 
JPEG a képeket először képsíkokra bontja: minden képsík egy-egy színkoordináta 
értékeit tartalmazza. Színkoordinátának az előzőekben bemutatott (Y" , Cp , C,.) hár- 
mast használjuk, mindegyiket 8-8 biten tárolva. Így egy képpontra összesen 24 bit 
jut. A JPEG tömörítő algoritmus számára a képsíkok gyakorlatilag egymástól füg- 
getlen képekként jelennek meg, külön-külön vannak kódolva. 

Megengedett, hogy a képsíkok felbontása eltérjen. Mindössze annyi a kikötés, 
hogy a felbontások aránya racionális legyen. A kép kitömörítésekor a felbontá- 
sok legkisebb közös többszörösének megfelelő felbontású képet állítunk vissza, 
ahol az egyes képsíkok képpontbeli értékeit lineáris interpolációval állítjuk elő 
a tárolt felbontással megegyező felbontásban rekonstruált képsík értékeiből. A 
különböző felbontású képsíkok alkalmazásának lehetőségét — az emberi látás tu- 
lajdonságairól tanultaknak megfelelően — úgy szokás kihasználni, hogy a Cs és 
C, képsíkok vízszintesen és függőlegesen is felére csökkentett felbontással vannak 
tárolva. Például 400 x 400 pontos kép esetén az Y" képsík felbontása 400 x 400, 
míg a Cs és C, képsíkok felbontása 200 x 200. Kitömörítésnél visszaállítjuk a 
400 x 400-as Y" képsíkot, és a két 200 x 200-as C; és C, képsíkot. Ezután a C; és 
C, képsíkokat lineáris interpolációval a kétszeresükre nagyítjuk, majd az így ka- 
pott két 400 x 400-as képsíkot és a 400 x 400-as Y képsíkot , vetítjük egymásra", 
hogy az eredeti képet kapjuk. 

Az algoritmus első lépése a képsíkok 8 x 8-as négyzetekre bontása. Ha a 
képméret nem osztható 8-cal, akkor a jobb szélső oszlop és/vagy a legalsó sor 
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többszörözésével azt 8-cal oszthatóvá tesszük. (Az így keletkező felesleges szé- 
lek levágása a dekódoló feladata — ezt a képméret alapján könnyű megtenni, a 
képméret pedig a JPEG fejlécben van tárolva.) Más tömörítési módszerek, ha arra 
kényszerülnek, hogy a bemenő adatsort meghosszabbítsák — valamilyen kötött 
blokkméret miatt —, akkor azt általában 0-kkal egészítik ki. Érdekes a JPEG 
megoldása erre az esetre. Az a furcsa, hogy egy igen információdús adatdarabbal 
történik a kiegészítés: a kép egy részletével. Sok egyéb algoritmus esetén a 0-kkal 
való feltöltés a 0 sorozat jó tömöríthetősége miatt ajánlott. Esetünkben azonban 
a tömörítés későbbi lépései arra építenek, hogy egy kép alapvetően homogén, és 
csak ott kell valamit lekódolni, ahol a kép változik. Ennek megfelelően a leg- 
nagyobb nehézséget az éles határok kódolása okozza — ezek kódolása teszi ki 
a tömörített adatfolyam legnagyobb részét, ezek térnek el legjobban a , minden 
egyszínű" megközelítéstől. A JPEG kódolás annyira jól használja ki a kép redun- 
danciáját, hogy több bitbe kerülne egy 0 sorral vagy oszloppal való kiegészítés 
által behozott új él lekódolása, mint az utosó sor már amúgy is feltérképezett szer- 
kezetének megismétlése. Ezért döntöttek a szabványban ezen megoldás mellett. 

A 8 x 8-as négyzeteket kétdimenziós DCT transzformációnak vetjük alá. 
Így ugyancsak 8 x 8-as négyzeteket kapunk, csak azok most már nem egész érté- 
kekből, hanem valós számokból állnak. Ezeket a frekvenciatartománybeli valós 
együtthatókat a következő lépés, a kvantálás fogja ismét egészekké alakítani. 

A kvantálás egyenletes, viszont a 8 x 8-as négyzet minden egyes elemére 
más lépésközzel hajtjuk végre. A 8 x 8-as DCT transzformált négyzet együttha- 
tói különböző frekvenciájú felharmonikusoknak felelnek meg. A kis frekvenciás 
együtthatók a négyzet bal felső részében vannak. Mint tudjuk, a szem ezekre 
a kisebb frekvenciához tartozó értékekre sokkal érzékenyebb, mint a nagyobb 
frekvenciához tartozókra, ezért ezeket finomabb lépésközzel fogjuk kvantálni. A 
szabvány nem köti meg, hogy milyen kvantálási lépésközöket használjunk. A 
használt lépésközöket táblázatba szokás foglalni, ahol egy táblázatelem a 8 x 8- 
as négyzet megfelelő együtthatójának kvantálási lépésközét tartalmazza. Bár a 
szabvány nem teszi kötelezővé a használatát, de ajánl egy kvantálási táblát: 


x l6 19 22 26 27 29 34 
16 16 22 24 27 29 34 37 
19 22 26 27 29 34 34 38 
22 22 26 27 29 34 37 40 
22 26 27 29 32 35 40 48 
26 27 29 32 35 40 48 58 
26 27 29 34 38 46 56 69 
27 29 35 38 46 56 69 83 


A 0 frekvenciához tartozó együttható (neve DC komponens) a DCT transzformá- 
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2.16. ábra. Cikk-cakk elrendezés. 


ció során a bal felső sarokba került. Kihasználva az egymás melletti képrészek 
viszonylag hasonló színét, a DC komponenst nem kvantáljuk, ehelyett az egy- 
más utáni 8 x 8-as blokkok DC komponenseinek különbségét vesszük. Ezért nem 
tartozik a DC komponenshez érték a kvantálási táblában. 

Látható, hogy a nagyobb frekvenciás együtthatókra nagyobb lépésközt ad meg 
a táblázat. Ennek eredményeképpen a nagyobb frekvenciás együtthatók kvantált 
értékei majdnem mind 0-k lesznek. Ezeket a 0-kat egy későbbi lépés (a futam- 
hossz kódolás) során jól tudjuk majd tömöríteni. A kvantálási tábla változtatása 
tehát lehetőséget ad a tömörítés mértékének és minőségének befolyásolására: a 
tömörítést növelni lehet a kvantálás lépésközének növelésével, a kép minőségé- 
nek rontása árán. 

A kvantált együtthatókat ezután az úgynevezett cikk-cakk elrendezés szerint 
sorbarendezzük (2.16. ábra). Így az első helyre a különbségi DC együttható kerül, 
azt követi a vízszintes alapharmonikus, majd a függőleges alapharmonikus, majd 
pedig az egyre növekvő frekvenciás felharmonikusok következnek. Köszönhe- 
tően annak, hogy a kvantálás során a táblázat magasabb frekvenciákhoz tartozó 
együtthatói nagyrészt kinullázódtak, a kapott sorozat a vége felé túlnyomórészt 
0-kból áll. Ezt használjuk ki a következő lépésben a futamhossz kódolással. 

A futamhossz kódolási lépésben a cikk-cakk elrendezéssel kapott, javarészt 
0-kból álló sorozatot részekre bontjuk úgy, hogy minden részsorozat eleje tetsző- 
leges számú 0-ból álljon, és ezt a végén egyetlen nem 0 elem zárja. Minden így 
kapott részsorozathoz egy ((n,s),v) számhármast rendelünk. n az adott részso- 
rozat elején levő 0-futam hossza, s jelzi, hogy a részsorozat végén található nem 
0 értéket hány biten kódoljuk, v pedig ezen nem 0 érték bináris ábrázolása. Az 
s változóra a tömörítés hatékonyságának növelése miatt van szükség, mert ugyan 
előfordulnak néha nagy abszolút értékű elemek, de ezek ritkák, így nem érdemes 
minden elemet azonos bithosszon kódolni. 
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Így például a 23,0,0,0,0, —7,0,—19,4,0,0,0,... sorozat első futamhossz- 
kódhármasa: ((0,6),010111), hiszen az első elem, a 23 előtt nincs 0, így n — 0. 
23 bináris számként 6 biten kódolható előjelesen, így s — 6. A további kódszavak: 
((4,4), 1000); (£1,6),101100); (f0,4j,0100)); . . . (Az előjeles bináris számokat 
egyes komplemens ábrázolásban tüntettük fel. Megfelelő technikával ezek 1 bittel 
rövidebben is kódolhatóak.) 

Az így kapott (ín, s), v) hármasok (n, s ) elemeit statikus Huffman-kóddal tö- 
mörítjük tovább, a v értékeket pedig egyszerűen elválasztójel nélkül egymás után 
írjuk. A statikus Huffman-kód azt jelenti, hogy nem az (n, 5) párok adott képben 
levő gyakorisága alapján választjuk a kódszavakat, hanem azok a JPEG szabvány- 
ban le vannak rögzítve. (A statikus kódot az (n,st párok sok képre vett átlagos 
gyakoriságai alapján tervezték meg.) Alkalmazhatnánk a Huffman-kódolást ma- 
gukra az (fn,s),v) hármasokra is, de akkor a kód annyira sok kódszóból állna, 
hogy kezelhetetlen lenne, nagyon lassú lenne vele dolgozni. A v értékek levá- 
lasztása jó döntés, mert ezzel a kód mérete kezelhető lesz, viszont a hatékonysága 
csak alig romlik: a v értékek bitjei a tapasztalat szerint gyakorlatilag függetle- 
nek és egyenletes eloszlásúak, így nem tömöríthetőek, hiába is vonnánk be őket a 
Huffman-kódba. 

A fenti példán bemutatva ezt az utolsó lépést, a tömörített képbe a (0,6), (4, 4), 
(1,6) és (10,4) Huffman-kódja, és a 01011110001011000100 sorozat kerül. 

Bár a baseline JPEG (a szabvány alapkódolása) nem engedi meg, de más, 
kiterjesztett módokban használhatunk aritmetikai kódolót is az (n,s5) párok kó- 
dolására. Ilyenkor általában a legjobb eredményeket adaptív aritmetikai kódoló 
használatával lehet elérni. 


A JPEG egyszerűsége ellenére meglepően alacsony bitsebességeket tud elérni. 
A képpontonkénti 2 bites tömörítés egy 24 bites színmélységű kép esetén az ere- 
detitől megkülönböztethetetlen képet eredményez — legalábbis az emberi szem 
számára nem látható a különbség. Igen kis, 1 bit/képpontos bitsebesség esetén 
kezd el zavaróvá válni a torzítás, és 0.5 bit/képpont alatt a kép nem élvezhető. A 
felismerhetőség még 0.086 bit/képpontos bitsebesség mellett is biztosítható. Ter- 
mészetesen ilyen alacsony bitsebességek esetén különböző kiterjesztések is szük- 
ségesek a szabványhoz. Mindenesetre ezek az eredmények nagyon jónak számí- 
tanak. A JPEG alacsony bitsebességek esetén legelőször , kockásodni" kezd. Ezt 
az alacsonyfrekvenciás együtthatók értékének kvantálás miatti torzulása okozza. 


Moving Picture Experts Group (MPEG) 


A Moving Picture Experts Group (MPEG) a JPEG-hez hasonlóan az ISO egyik 
munkacsoportja (ISO/IEC JTC 1 / SC 29 / WG 11). Feladatuk olyan video- 
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tömörítési szabványok kidolgozása volt, melyek széleskörű ipari konszenzuson 
alapulnak. Az ilyen jellegű szabványokra a digitális konvergencia időszakában 
mind a tartalom előállítóknak, mind a felhasználóknak, mind a közöttük álló szol- 
gáltatóknak szükségük van. Az MPEG egy öt szabványból álló szabványcsomag 
kidolgozását tűzte ki célul, mely a veszteséges videotömörítés (beleértve a hang- 
tömörítést is), a digitális televíziózás és a multimédiás alkalmazások széles körét 


fedi le. Az öt szabvány: MPEG- 1 , MPEG-2, MPEG-4, MPEG-7 és MPEG-21. 


A CD-olvasók első generációja a hifi minőségű tömörítetlen zenéhez szüksé- 
ges, 1.4 Mbit/s lejátszási sebességre volt képes. Az MPEG-1 szabvány kialakítá- 
sakor azt tűzték ki célul, hogy a fenti sebességű, egyszeres (1 x) CD-meghajtók 
olvasási sebességén használható formátumot hozzanak létre. Ez nehéz feladat 
volt, hiszen egy 8 biten mintavételezett video (NTSC vagy PAL) tömörítetlenül 
nagyságrendileg 200 Mbit/s átviteli sebességet igényel. A szükséges tömörítés 
tehát nagyjából 1 : 140 kell hogy legyen, sőt még a hangcsatorná(k)nak és a hiba- 
javító kódnak is helyet kell szorítani. A nagy tömörítési igény mellett a , véletlen 
elérés" lehetőségét is teljesíteni kellett, vagyis azt, hogy a tárolt video bármelyik 
részét (akár a közepét is) gyorsan el lehessen érni. Amennyiben prediktív algo- 
ritmussal tömörítünk, problémát okozhat ennek a kritériumnak a megvalósítása, 
hiszen ilyenkor csak a kezdeti, biztos ponttól elindulva lehetséges a rekonstrukció. 
Viszont a prediktív algoritmusok kizárása szóba sem jöhetett, hiszen ezek nélkül 
remény sincs ilyen tömörítés elérésére. Az MPEG által választott megoldás a rö- 
vid, de egymástól független prediktív blokkok alkalmazása volt. Az MPEG-1 — 
bár egy kimagaslóan jó videotömörítési algoritmus — az 1 x -es CD-ROM-ok se- 
bességének megfelelő, igen erős tömörítést csak viszonylag gyenge képminőség 
mellett tudja megvalósítani. Azonban 1992-ben, amikor a szabvány megjelent, az 
ipar ezzel a minőséggel is megelégedett. A szabvány sikeres alkalmazásai többek 
között a CD-I és a Video-CD technológiák. 


Az MPEG-2 szabványt a digitális televíziózáshoz fejlesztették ki. Ehhez az 
MPEG-I1 segítségével elérhetőnél jobb minőségre volt szükség, támogatja például 
a szabvány a HDTV video tömörítését is. A HDTV technológia, a High Definition 
TeleVision a szokványos televízióminőségnél nagyobb felbontású és színmély- 
ségű, CD-minőségű hanggal kísért televíziós szabvány. Az MPEG-2 által igényelt 
bitsebesség (a minőség függvényében) 1—40 Mbit/s között alakul. Jellegzetes ér- 
tékek a 4-6 Mbit/s hagyományos (PAL) videojel esetén, és a 12—20 Mbit/s HDTV 
videojel esetén. Digitális televíziózás során gondoskodni kell a tömörítésen kívül 
a jelátvitelről, multiplexelésről is. Az MPEG-2 szabvány egyik sikeres alkalma- 
zása, az Európában szabványosított DVB (Digital Video Broadcasting) techno- 
lógia. Ez a digitális műsorszórást teszi lehetővé, hagyományos földi (83 MHz 
sávszélességű) televíziócsatornában OPSK vagy COFDM modulációval, illetve 
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műholdas (36 MHz sávszélességű) csatornában BPSK modulációval. Mindkét 
esetben 3-6 televízióműsor multiplex átvitelére van lehetőség. Az MPEG-2 to- 
vábbi sikeres alkalmazása a VoD (Video on Demand), és a számítástechnikában 
egyre népszerűbb DVD is. 

Az MPEG-4 a multimédia alkalmazások szabványa. Közös technológiai ala- 
pot nyújt a műsorszórásos, az interaktív és a beszélgetés-jellegű szolgáltatások- 
hoz. Sokrétű interaktivitást tesz lehetővé a hagyományos lejátszás-megállítás— 
előre/visszatekerés mellett. Képes szintetikus (pl. számítógép-animáció) és ter- 
mészetes forrásból származó (pl. videokamera által rögzített) információtípusok 
együttes kezelésére. A bitsebességek igen széles skáláját támogatja, egészen 10 
kbit/s-tól kezdve. Többek között lehetséges MPEG-4-gyel egy videokonferencia 
64 kbit/s-os tömörítése és a professzionális HDTV tömörítése is 40 Mbit/s sebes- 
séggel. Bár a szabvány már teljesen kész, egyes bővítésein jelenleg is dolgoznak. 
Az MPEG-4 egyik sikeres alkalmazása a DivX. 

Az MPEG-7 a többi MPEG szabvány által kódolt információtípusok katalogi- 
zálására, címkézésére fog lehetőséget adni, még fejlesztés alatt áll. Az MPEG-21 
szabvány egy egységes multimédia keretrendszer lesz. 

A továbbiakban az MPEG-1 szabvány videotömörítési részének vázát fogjuk 
áttekinteni. Fontos megjegyezni, hogy az MPEG-1 emellett foglalkozik a hangtö- 
mörítéssel, valamint a video- és hangfolyamok multiplexelésével is. A hangtömö- 
rítési részről a 2.9. szakaszban már volt szó. 

A szabvány kidolgozása során kiemelt figyelmet fordítottak az implementáció 
szabadságára. A videotömörítési részében az MPEG- 1 szabvány csak a tömörített 
bitfolyam szintaxisát és értelmezését írja le. A kódoló tetszőleges algoritmussal 
dolgozhat, de természetesen csak szintaktikailag helyes bitfolyamot állíthat elő. 
Nagyon sok múlik azon — mind képminőség, mind pedig bitsebesség tekinteté- 
ben — hogy egy kódoló mennyire jól tudja kihasználni az MPEG-1 szabvány adta 
lehetőségeket. A dekódoló implementálása terén a bitfolyam kötött értelmezése 
miatt nincs nagy szabadság. A szabvány ad is egy referencia dekódert, bár ennek 
használata nem kötelező. 





A 2.17. ábrán a bitfolyam szabvány által definiált szintaktikai felépítése lát- 
ható. A legkülső elem a videoszekvencia (ezt nem tüntettük fel az ábrán). Egy 
videoszekvenciának adott képmérete, képsebessége és egyéb jellemző paraméte- 
rei vannak. A videoszekvencia fejléce ezek leírását tartalmazza. 

A videoszekvencia belsejében képcsoportok (Group Of Pictures, GOP) van- 
nak, amelyek néhány, közelebbről meg nem határozott számú kép egymásutánjá- 


ból állnak. Ennek jelentőségét később fogjuk megérteni, most csak annyit, hogy 
a képcsoportok az egymástól függetlenül kódolt prediktív egységek. 


A képcsoporton belül képek helyezkednek el. A kép háromféle lehet, I, P 
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2.17. ábra. Az MPEG bitfolyam szintaktikai felépítése. 


ZET - ő 


vagy B. Ez az alkalmazott predikció fajtájával van összefüggésben. Ezt is később 
tárgyaljuk. 

A képek sávokra vannak bontva. A sávok elején egy különleges, máshol elő 
nem forduló bitminta található, mely a szinkronizációra ad lehetőséget adatátviteli 
hibák esetén. 

A sávok makroblokkokra vannak bontva. Egy makroblokk a kép egy 16 x 16 
képpont méretű részét írja le. 

Egy makroblokk 6 blokkból áll. Mindegyik blokk egy 8 x 8 elemű mátrix. 
Ennek az a magyarázata, hogy a képek az (Y",C,,C,) színkoordináta-rendszer 
szerint vannak tárolva. A krominancia-együtthatókat (C, és C,) vízszintesen és 
függőlegesen is egy kettes faktorral csökkentett felbontásban tároljuk, az emberi 
szem érzékenységéről leírtakkal összhangban. Így tehát egy 16 x 16 képpont mé- 
retű rész leírásához szükség van egy 16 x 16-os luminancia (Y") mátrixra, és két 
8 x 8-as krominancia (C; , C,) mártixra. A 16 x 16-os luminancia mátrixot 4 darab 
8 x 8-as mátrixra bontjuk, így jön ki a makroblokkonkénti 6 blokk. 

A tömörítési algoritmus lelke a mozgásbecslés. Ez tulajdonképpen egy pre- 
dikciós kódolás, ahol a video adatfolyam egymás utáni képeinek hasonlóságát 
használjuk ki. A predikciót makroblokk szinten végezzük: minden makroblokk- 
hoz kikeressük az időben megelőző és az időben következő képeken található, 
hozzájuk leginkább hasonló részleteket. A megelőző és a következő képeken a 
hasonló részek helyét az úgynevezett mozgásvektorral határozzuk meg. A mak- 
roblokknak csak ezen referencia-képrészektől való eltérését (vagyis a predikció 
hibáját) kódoljuk. Ezt a hibát vágjuk a fent bemutatott módon 6 blokkra, és ezután 
a blokkokat a JPEG módszernél megismert DCT — kvantálás — futamhossz 
kódolás — Huffman-kódolás sémának megfelelően tömörítjük tovább. Minden 
makroblokk kódolásához tehát két mozgásvektort, és 6 JPEG kódolású blokkot 
adunk meg. 
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2.18. ábra. Az MPEG különböző predikciótípusai. 


Valójában az eljárás kicsit árnyaltabb a fentinél. Egy makroblokk tömörítése 
során ugyanis négyféle módon járhatunk el. Tömöríthetjük predikció nélkül, vagy 
predikcióval hátulról, elölről, és mindkét irányból. Amennyiben nem alkalmaz- 
tunk predikciót, úgy az eredeti makroblokk 6 blokkját kell JPEG-szerűen kódol- 
nunk. Amennyiben egyirányú predikciót alkalmaztunk (időben megelőző vagy 
következő kép egy részét jelöltük ki), akkor a makroblokkból levonjuk a kijelölt 
részt, és a különbséget tömörítjük. Amennyiben kétirányú predikciót hajtottunk 


végre (időben megelőző és következő kép egy-egy részletét is felhasználjuk), ak- 
kor a makroblokkból a JPEG tömörítés előtt a két kijelölt rész átlagát vonjuk le. 


Az elölről és a kétirányból alkalmazott predikciónál gondoskodni kell az egyér- 
telmű dekódolhatóságról. Ezt az MPEG- 1 szabvány azzal oldja meg, hogy kizárja, 
hogy a képek körkörösen egymásra hivatkozzanak. Ennek biztosítására minden 
egyes képben meg van kötve, hogy a benne szereplő makroblokkok kódolása so- 
rán milyen típusú predikciót használhatunk. Ezt mutatjuk be a 2.18. ábrán. 

I típusú képben egyáltalán nem alkalmazhatunk predikciót, azaz egy I kép egy 
önálló kép, JPEG típusú tömörítéssel. Így egy I típusú képet tehát minden egyéb 
kép nélkül tudunk dekódolni. 

A P típusú képek makroblokkjai lehetnek predikció nélkül kódolva, vagy pe- 
dig predikcióval hátulról, a hozzájuk legközelebb levő I vagy P típusú képből. 
(Tehát a makroblokkok kódolásának további finomsága, hogy a predikció nem az 
időben közvetlenül megelőző kép alapján történik, hanem a közvetlenül megelőző 
I vagy P kép alapján.) Egy P típusú kép dekódolásához ezek szerint legfeljebb az 
előtte levő utolsó I képig kell visszaszaladnunk, és innentől kezdve P képről P 
képre tudunk lépkedni. 
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A harmadik fajta kép, a B kép bármilyen kódolású makroblokkokat tartalmaz- 
hat, de a makroblokkok csak a legközeleb eső megelőző vagy következő P vagy I 
képekre hivatkozhatnak. Sem B képekre, sem a legközelebbi I vagy P képnél tá- 
volabbi képekre nem lehet hivatkozni. A lényegi különbség a B és P képek között 
az, hogy B képekénél jövőbeli P vagy I képre is hivatkozhatunk. 

Természetesen, a szabvány koncepciójának megfelelően a képek sorrendje 
nem kötött, akárhogyan jöhetnek egymás után a BP, I és B képek, ahogy a kódoló 
akarja. A fenti szabályok betartásával lehetséges a dekódolás, mert egy I típusú 
kép magában dekódolható, egy P típusú az előtte levő, hozzá legközelebbi I kép- 
től indulva dekódolható, míg egy B kép az őt körülvevő I vagy P képek alapján 
dekódolható — tehát minden kép dekódolható. 

Mindemellett hogy nem kötelező, kialakultak szokványos képsorrendek. A 
legsűrűbben egy I képre két P kép épül, és közöttük két-két B kép van. A 2.18. 
ábrán egy ilyen képsorrend látható. 

A képek sorrendje a bitfolyamban nem egyezik meg a képek idősorrendjé- 
vel. A bitfolyambeli sorrend úgy lett meghatározva, hogy ha sorban olvassuk be 
a bitfolyamból a képeket, akkor egy kép beolvasásának időpontjában az összes 
szükséges információ rendelkezésre álljon a dekódoláshoz. Ezt úgy oljda meg a 
szabvány, hogy hátraküldi a B képeket az utánuk következő I vagy P kép mögé. 
Ezáltal a B képek időben előre mutató referenciája a bittolyamban hátramutató 
referencia lesz. Természetesen átrendezéskor az I és P képek a helyükön marad- 
nak, és a B képek egymáshoz viszonyított sorrendjén sem változtatunk. Tehát, ha 
az időbeli sorrendet az indexekkel jelöljük, akkor a 
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sorozat lesz. 

Egy képcsoport mindig egy I képpel kezdődik, méghozzá a bitfolyambeli sor- 
rend szerint. Emiatt egy képcsoport bitfolyamban első képe önmagában dekódol- 
ható, vagyis nem szükséges régebben dekódolt képek ismerete a dekódolásához. 
A képcsoport további képei is mind dekódolhatóak a bitfolyambeli sorrendben. 
(Természetesen ezek dekódolása során szükségünk lesz az ezen képcsoportból 


24 


előttük dekódolt képekre.) Kivételt képeznek az első P képet megelőző B képek, 


2 


ugyanis ezek a megelőző képcsoport utolsó P vagy I képére is hivatkozhatnak. (Ne 
felejtsük el, hogy a bitfolyambeli sorrendben definiáljuk a képcsoportot!) Ezek a 


2 


B képek a megelőző képcsoport dekódolása nélkül nem dekódolhatóak. Emiatt 
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az első néhány nem dekódolható B kép miatt hívják nyíltnak az ilyen képcso- 
portot. (A szabvány definiál egy zárt képcsoportot is, természetesen ehhez más 
képsorrend szükséges.) Ezáltal a képcsoport a bevezetőben említett viszonylag 
rövid prediktív egységet testesíti meg, hiszen (nyílt csoport esetén néhány B kép 
kivételével) a képcsoportok egymástól függetlenül dekódolhatóak. 

Az MPEG videokódolás, amennyiben ezt nem szabályozzuk külön, változó 
bitsebességet fog eredményezni. Gondoljunk például arra, hogy ahol egy teljesen 
új kép jelenik meg a videofolyamban (vágás), ott az első kép makroblokkjait nem 
tudjuk predikcióval tömöríteni, és így gyakorlatilag egy teljes képet kell JPEG-gel 
kódolnunk. Ez igen sok bitet igényelhet. Ott viszont ahol egy állókép van a vi- 
deofolyamban, szinte nem is lesz predikciós maradék, vagyis nagyon rövid lesz a 
kód. Az átvitelhez használt csatorna bitsebességét (MPEG- 1 esetén a CD lejátszó 
1.4 Mbit/s sebessége, MPEG-2 esetén pl. az egy televízióadásra jutó adatfolyam 5 
Mbit/s sebessége) a kódolás során természetesen nem léphetjük át. Ezen a prob- 
lémán pufferek felhasználásával valamennyit lehet segíteni, de meg kell oldani, 
hogy a dekódoló puffere sohase ürüljön ki, és sohase csorduljon túl, továbbá a kó- 
doló is csak a csatorna átviteli képességének megfelelő mennyiségű adatot hozzon 
létre. Ennek eléréséhez a kódoló állandóan figyeli a saját pufferét, és nyomon kö- 
veti a dekódolóét is. (Ez utóbbihoz egyes esetekben a dekódoló szimulációjára 
kényszerül.) Ha például a kódoló puffere kezd megtelni — ezt a képsorozat infor- 
mációdússága okozhatja, — csökkentenie kell a képenként átvitt bitek mennyi- 
ségét. Ezt a JPEG kvantálási lépcső megemelésével érheti el, természetesen a 
minőség rovására. Durvább megoldás, ha bizonyos makroblokk predikciós mara- 
dékát egyszerűen elhagyja a kódból, és csak a mozgásvektorokat adja meg. Még 
durvább lehetőségek is rendelkezésére állnak a kódolónak. Ilyen például a be- 
menetén érkező kép információtartalmának korlátozása, például a képfrekvencia 
vagy a felbontás csökkentésével. 








2.11.  Forráskódolás betűnkénti hűségkritériummal 
Ebben a szakaszban áttekintjük a veszteséges (torzítást megengedő) forráskódolás 
elvi határait. A vizsgálat során kulcsszerepet játszik a kölcsönös információ. 


2.3. definíció. Az X és Y diszkrét valószínűségi változók kölcsönös informá- 
cióján az 
I(X;Y) — H(X) 4H(VW)—H(XY) 
mennyiséget értjük. 
A definíció mutatja, hogy a kölcsönös információ szimmetrikus, és 


I(X;Y) —H(X)—H(XIY) —H(Y)—H(Y 1X) —I(YX). 
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Két valószínűségi vektorváltozó kölcsönös információja a fenti definícióból érte- 


lemszerűen következik. 


2.8. tétel (A kölcsönös információ tulajdonságai). 


a) 


KXGY) 


b) 


c) 








YA 4. ayiss POGY) 
7 LD pó] 
egz ttiejaszHlBD 
7 2pl LÖKET 

za ás sg ábÁkÓ 

77 esztl log? 5" 
KXY) 30. 


I(X;GY) S H(X), 


KX;Y) c H(Y). 


d) Az X ésY bármely g és f függvényére 


I(XGY) 2 I(9(XI. TV). 


BIZONYÍTÁS: Az a), b) és c) tulajdonságok a definícióból és a (feltételes) entró- 
pia tulajdonságaiból közvetlenül adódnak. A d) tulajdonság a feltételes entrópia 
1.7. d) tulajdonságából következik: 


KXGY) 


IV 


IV 


Tegyük fel, hogy egy X információforrás k hosszú blokkját, X1.X? . . 
Y, k-hosszú blokkal reprezentáljuk, ahol az X;-k és Y;-k a 


kódolással egy Y17? ... 


v 


H(X)—H(XIY)2 
H(X)—H(XIf(W))— 


I(X;f(Y)) — 

H(JW)—-HU(W)IX)2 

H(fY)—HU() 1 e(x)) — 

I(9(X)f(Y)). Hi 
. Xx-t egy 
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véges X illetve y halmazokból veszik értékeiket. Legyen X x y-on adva egy d : 
Xx4y—- Rt nemnegatív függvény. A d függvényt torzítási mértéknek nevezzük, 
mert minden x € X, y e 4 párra d(x,y) azt a torzítást méri, amit az okoz, hogy az 
x forrásbetűt y-nal reprezentáljuk. Azx— Xx1...xxésy —y1...yk Oi e X,yi e 4) 
blokkok közti torzítást a 


14 
d(x,y) — k DF d(xi.yi) 
i—1 


nemnegatív mennyiség méri. Ezt nevezzük betűnkénti torzításnak. Ha az X 
forrás X — (XI), . . . , Xx) blokkját az Y — (Y7, . . . , £4) blokk reprezentálja, akkor a 
köztük levő E(d) átlagos betűnkénti torzítást az 


E(d) — E(d(X,Y))— E.p(x,y)a(xy) 





várható érték méri, ahol p(x,y) — Pf(X—x,Y —y]) és az összegzés az összes 
x c X" és y c 4 vektorra kiterjed. 





2.6. példa. Legyen X — 4, vagyis a forrás- és a reprodukciós ábécé ugyanaz, és 
legyen d az ún. Hamming-torzítás: 


0, hax—y 
1, hax£y 


vagyis, ha a reprodukció tökéletes, akkor a torzítás nulla, egyébként pedig egy. 
Ekkor 


d(x,y) — ( 


lé lé 
i—1 i—1 
A d definíciója szerint 
E(dGY)) — PAX 7 Xi, 
tehát 


k 
EX EPO ZH, 


vagyis E(d) az egyes pozíciókban történő karaktertévesztések valószínűségeinek 
átlaga. E(d)-t nem szabad összetévesztenünk a 2.1. szakaszban vizsgált blokkhiba- 
valószínűséggel. 


2.7. példa. Legyen X — y — R, és d(x,y) — (x—y)?, ekkor 
E (d(X,Y)) —EIIX — YIP, 


vagyis a kvantálásnál használt négyzetes torzítást kapjuk. 
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Most, hogy a betűnkénti torzítás fogalmát bevezettük, megadhatunk egy ilyen 
hűségkritériumot. Mondhatjuk például azt, hogy az XI . . .Xx blokk reprodukció- 
jaként elfogadjuk NY] . . . Yxg blokkot, ha egy adott ő 5 0 számra 


1 k 
E (ride) £ 68. 


Ezt nevezzük betűnkénti hűségkritériumnak. 

A 2.6. példa szerint ez pl. azt jelentheti, hogy egy 0 a ő a 1 számra biztosí- 
tani szeretnénk, hogy a karakterek meghibásodásának átlagos valószínűsége 8-nál 
kisebb legyen. 

A forrás adott hűségű kódolására forráskódokat használunk. Az X forrás k- 
hosszú blokkjait kódoló forráskódja egy g : X" — y" leképezés, amely tehát min- 
den x ec X" üzenethez egy y c 4" reprezentánst rendel. Az előbbiek szerint a 
forráskód betűnkénti átlagos torzítása a 


D(g) — E(d(X, 2(x))) — Y.p(x)d(x,8(x)) 


mennyiség. Ha a g forráskód értékkészleteként M darab vektort használ az 4" 
vektorai közül, akkor a g jelsebessége az 





. logM 
0 k 


R 


szám lesz, hiszen a g lehetséges M értékét log M biten, forrásbetűnként Et -R 
biten lehet kódolni. A forráskódolás célja az, hogy a forrást adott hűségű, minél 
kisebb jelsebességű kóddal kódoljuk, hiszen a jelsebesség az átvitel illetve tárolás 
, költségét" jelenti. Ha a g értékkészlete a € — (fy1,y2,...,ymhb. (Yi € ur i — 
1, . . . M) halmaz, akkor a legkisebb torzítás eléréséhez g a következő kell legyen: 


8(x)—yi, ha d(x,y;) Cd(x,yj), j—1,2,....M, 


vagyis az x c X" kódja az az y c C amely a legjobban , hasonlít" x-re. A g le- 
képezés tehát egy vektorkvantáló. Ha a d hűségkritériumot egyfajta távolságnak 
tekintjük, akkor azt mondhatjuk, hogy g(x) az x legközelebbi szomszédja a C hal- 
mazból. Jó kód keresése ezek szerint a megfelelő C halmaz keresésével ekviva- 
lens. A továbbiakban a forráskódok teljesítőképességének elvi határait vizsgáljuk 
emlékezetnélküli stacionárius forrásra. 

A következőkben bevezetjük az emlékezetnélküli stacionárius forrás R-D (rate- 
distortion) függvényét, amelyről kiderül, hogy megadja azt a legkisebb jelsebes- 
séget, amit egy legfeljebb ő torzítású forráskóddal el lehet érni. 
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2.4. definíció. Legyen adva az 4y reprodukciós ábécé és a d torzítási mérték. Ek- 
kor az X emlékezetnélküli stacionárius forrás ő 2 0 számokra értelmezett R-D 
függvénye a következő: 


R(ö) — min (I(X;Y) : E(d(X,Y)) £ 5), 


ahol a minimumot az összes olyan (X,Y) valószínűségi változópár fölött kell 
venni, ahol X eloszlása megegyezik az X;-k (közös) eloszlásával és Y az y hal- 
mazból veszi értékeit. Ha nincs olyan Y, amellyel E(d(X,Y)) 2 ő, akkor legyen 
R(ö) — oo. 

MEGJEGYZÉS: 


a) Vegyük észre, hogy ha a ömin 2 0 számot a 


Ömin E s2E2h )mind( (x ,y) 


kifejezéssel definiáljuk, akkor bármely Y-ra 
E(d(X,Y)) 2 Ömin 
hiszen 


E(d(X,Y)) — Epekydty2 


2 ÉpG,y) mind(x,y) — 
xy 


s 2abb9 Jatinak (x,y). 


Ezek szerint R(ö) — co akkor és csak akkor, ha ő 2 Ömin. 


b) Mivel az X eloszlása rögzített, az (X,Y) pár eloszlását a p(y ] x) — 
P(Y—y]X cx) felételes eloszlások határozzák meg p(y,x) — p(x)p(y]x) 
szerint. Figyelembe véve a kölcsönös információ definícióját, az R(ö) defi- 
níciója, a p(ly)— E p(x)pWl]x) egyenlőséget felhasználva a következő- 

xeXx 


képpen írható át: 





Ji p(x)pwlx) 
LN ER LEO YE TOTTETETN [z 
heg xeXx 


ahol a minimumot az összes olyan p(y ] x) feltételes eloszlás fölött vesszük, 
amelyekre E pC9)pwI9díx,y) S ö. 
x.y 
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A következőkben megvizsgáljuk az R(ő) függvény néhány alapvető tulajdon- 
ságát. 
2.3. lemma. R(ö) a ö monoton fogyó és konvex függvénye, ha ö 2 Ömin. 
BIZONYÍTÁS: Az R(8) definíciójából közvetlenül látszik, hogy R(ő) monoton 
fogy, hiszen ha 6" a 6" akkor a feltételes eloszlások halmaza, amely felett a mini- 


mumot vesszük, ő" esetében szűkebb, mint 8" esetében, tehát R(ő/) 2 R(6"). 
Legyen most 0 CA c 1 és 81,82 2 Ömin. Azt kell belátnunk, hogy 


R(Xő1 4 (1—1)ö2) CAR(ö1) 4 (1—AJR(62). 


Legyenek p1(y ] x) és p2(y [ x) azon feltételes eloszlások, amelyekre az R(ö) defi- 
níciójában I(X; Y ) eléri minimumát, R(ö1)-et illetve R(ő2)-t. Jelöljük a p1(y ] x) és 
p2(y 1 x) feltételes eloszlások által meghatározott valószínűségi változókat Y1-gyel 
illetve X2-vel. Ekkor 

KX;Y) — R(50), 


E(d(X:Y)) 25, — i—1,2. 
Definiáljunk egy új p(y I x) feltételes eloszlást a következőképp: 
pWy[29— pi 19 1—Mpolylx) xeXxyed. 


Ha Y az a valószínűségi változó, melynek feltételes eloszlása X-re p(y ] x), akkor 
könnyen belátható, hogy minden y € 4-ra 


ÉT 
AP(Y —yt4(1—MP(Y2 —y) — 
— Api()4(1—AM)p20), 


p(Wy) 


valamint 


7 2Pe9) ) Api 13) -4(1—M poly 1 x))d(x,y) — 


4E BR ersz 25P )p2(y Ix)d(x,y) — 
— NE(4(XGY1)) 4 (1— ME(4(X:19)) 
SL hő1T1(1—24)ő2. 
Mivel tehát E(d(X;Y)) C hő1 3-(1—4)ő2 teljesül, az R(ő) definíciójából követ- 


kezik, hogy 
I(X;Y) 2 R(Aö11-(1—4)62). (2.30) 
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Másrészt, a Jensen-egyenlőtlenség 1.2. b) következményéből 
pilx,y) — pb) pily I x), i — 1,2 jelöléssel 








Ape) log AP FU —MP2(ay) 
KA AGE SZET EN DESTELTZÜJ e 
pi(xy) p2(x,y) 
STÁEKÉSÉ ZO Data VS epit 989 


Ha (2.31) mindkét oldalát minden x-re és y-ra összegezzük, akkor azt kapjuk, 
hogy 


I(XGY) c M(X;GYY) 4 (1—AJI(X; Yo) —AR(ő1) 4 (1—MR(62), 


amiből (2.30)-cal együtt a lemma állítása adódik. Hi 


2.4. lemma. — Amennyiben az X emlékezetnélküli stacionárius forrás X — 
(X1..X2., : . ., Xx) blokkja és az Y — (Y1,Y2, . . . , Yx) valószínűségi vektorváltozók ki- 
elégítik az 


1 k 
E (ride) £6ő 


hűségkritériumot, akkor 
I(X;Y) 2 KkR(Ö). 


BIZONYÍTÁS: A feltételes entrópia 1.7. e) és c) tulajdonságai szerint 
k 


HXIY—-YHOGIY,X,....X-1) S EHET. 
i—1 


a. 


i—1 i 


Ezt és az X;-k függetlenségét felhasználva azt kapjuk, hogy 


I(XGY) 


H(X)—H(XIY) — 


I 
TB- 


H(X)—H(XIY 3 


II 
s 


(H(X) — H(X; 1 X)) 


II 
jei 


j iv 
Dds IDT 


I(XGY;). (2.32) 


II 
si 
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Ha ő; — E(d(X;, Y;) ), akkor a tétel feltétele szerint 


k 
Y5Sö 
i—1 


a] — 


tehát (2.32) felhasználásával, mivel R(ő) monoton fogyó és konvex 


1 1 


e] 


k 1 4 1 4 
ZA OGY) 2 pe Rlz25 2 R(ö 
amivel a lemmát beláttuk. HI 


Most bebizonyítjuk a forráskódolási tétel megfordítását, ami azt mondja ki, 
hogy egy 6-nál kisebb torzítású forráskód jelsebessége nem lehet kisebb R(ő)-nál. 


2.9. tétel (A forráskódolási tétel megfordítása). Ha az X emlékezetnélküli és 
stacionárius forrás g : X" — yt forráskódja, amely M különböző kódszót használ, 
valamely ő 2 Ömin számra kielégíti a 


D(g) 8 
hűségkritériumot, akkor a kód R — post jelsebességére 
R2 R(ö). 


BIZONYÍTÁS: A kölcsönös információ 2.8. c) és az entrópia 1.6. a) tulajdonsága 
szerint 


I(X;8(X)) S H(8(x)) £ logM. 
Másrészt a 2.4. lemmából 
I(Xg(X)) 2 KR(5), 


tehát 
logM 2 KR(ő), 


amivel az állítást bebizonyítottuk. 1. 
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A következő tétel, ami a fejezet főtétele, megmutatja, hogy R(ö) valóban a ő 
torzítással elérhető jelsebességet jelenti. 


2.11. HFORRÁSKÓDOLÁS BETŰNKÉNTI HŰSÉGKRITÉRIUMMAL 145 


2.10. tétel (Forráskódolási tétel emlékezetnélküli stacionárius forrásokra). 
Legyen R(ö) az X emlékezetnélküli stacionárius forrás R-D függvénye egy adott 
reprodukciós ábécére és d torzítási mértékre. Ekkor, ha ő 2 Ömin, akkor minden 
8 58 és R" 5 R(ö) esetén elég nagy k-ra létezik egy, az X forrás k-hosszú blokk- 
jait kódoló g forráskód M darab kódszóval, amelyre 


M a 2R 


D(g) c 5. 


A tétel tehát azt mutatja, hogy elég hosszú blokkokat kódolva a kódsebes- 
ség alsó határa, R(8), tetszőlegesen közelíthető ő-hoz tetszőlegesen közeli torzí- 
tású forráskóddal. A tételt nem bizonyítjuk, mivel a bizonyítás nem túl egyszerű. 
Annyit meg kell jegyezni, hogy a tétel bizonyítása egy, az információelméletben 
gyakran és sikeresen alkalmazott technikán, a véletlen kódoláson alapul. A vé- 
letlen kódolással a csatornakódolási tétel bizonyításakor találkozunk majd, amely 
bizonyítás meglehetősen hasonlít a forráskódolási tétel bizonyításához. 


ábécé megegyeznek, és 
. jJ 0, hax—y, 
dry) — 1, hax4y 


Legyen X emlékezetnélküli és stacionárius P(X; — x) — Pf(X — x) adott eloszlás- 
sal. Számítsuk ki az R(0) értékét! 
Mivel 
E(d(XY))—PíiXx 77], 
ezért az E(d(X,Y)) 2 ő feltétel ö — 0 esetében a PÍX —Y) — 1 feltételt jelenti, 
vagyis ekkor Y 1-valószínűséggel meghatározza X-et. Ekkor viszont 


I(XGY) — H(X) —H(X 1Y) — H(X), 
vagyis 

R(0)— H(X)—H(X). 
Ebben az esetben a forráskódolási tétel azt mondja ki, hogy tetszőleges kis ő po- 
zitív számra találhatunk egy g : X" 5 X" forráskódot, hogy 


a. 


S P(X; — Y;) c ő, 
k zi 


ahol Y;-vel a g(X1, . . ., Xx) i-edik koordinátáját jelöltük, és a kód jelsebessége a 
forrás entrópiájához nagyon közeli szám, azaz körülbelül 270) kódszót használ. 
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2.12. Feladatok 


2.1. feladat (Fix szóhosszúságú kód). Legyen X egy stacionárius, memóriamen- 
tes bináris forrás, Pf(Xi — 1) — 0.005, PfXi — 0) — 0.995 eloszlással. Azokhoz 
a 100 hosszúságú blokkokhoz rendelünk kódszavakat, amelyek legfeljebb három 
egyest tartalmaznak. Ha minden kódszó azonos hosszúságú, akkor mi az a mi- 
nimális hosszúság, amellyel ez a kód megvalósítható? Mekkora a nem kódolt 
blokkok összvalószínűsége pontosan, és milyen becslést kapunk erre a számra a 
Csebisev-egyenlőtlenségből? 


2.2. feladat (Normális eloszlás egy bites kvantálása). Legyen X nulla várható 
értékű, c szórású normális eloszlású valószínűségi változó. Határozza meg az 
optimális egy bites (két szintű) kvantálót! Mennyi a torzítás? 


2.3. feladat (Exponenciális eloszlás kvantálása). Legyen X valós valószínűségi 


változó, melynek sűrűségfüggvénye 


ce72t, haxe [02] 


fazis hax 2 [0.2] 7 


PT 


ahol c olyan konstans, hogy f valószínűségi sűrűségfüggvény. 


a) Kvantáljuk X-et egy [0,2]-re illeszkedő 4 bites (16 szintű) egyenletes 01 
kvantálóval. A tanult közelítéseket használva számolja ki a kvantáló négy- 
Zetes torzítását és a H(O01(X ) ) entrópiát! 


b) Legyen most 
1 
.] 587, hax20 
6) ( 0, haxc0 


Kvantáljuk X-et a következőképpen: 


. f 91(x), hax e [0,2] 
06 - ( 2, hax52 


Az a) rész eredményét felhasználva számolja ki a H(O(X ) ) entrópiát! 
(Segítség: Legyen Z — 0, ha X € [0,2], és Z — 1, ha X 5 2. Ekkor H(O(X)) — 
H(O(X),2) —H(Z) 3 H(O(X) 12).) 


PLZ 


2.4. feladat. Az ábrán látható f(x) sűrűségfüggvényű X valószínűségi változót 2 
bites egyenletes kvantálóval kvantáljuk, mely illeszkedik a [—1, 1] intervallumra. 


a) Számolja ki pontosan a kvantáló négyzetes torzítását és kimenetének ent- 
rópiáját! 
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b) Számolja ki a fenti két mennyiséget a tanult közelítéseket felhasználva! 
Mennyire egyeznek a pontos és közelítő értékek? 


Xx 
(Segítség: JVTNEGS — x? (5 — 2) 


fe) 








2.5. feladat. A napsütéses és esős napok stacionárius Markov-lánc szerint kö- 
vetik egymást az ábrán látható átmenetvalószínűségekkel. Az esős napokon az 
eső mennyisége exponenciális eloszlású, f(x) — e" (x 5 0) sűrűségfüggvénnyel 
(centiméterben mérve). Az időjárásjelentésben az eső mennyiségét 1 milliméter 
felbontásban egyenletesen kvantálva mondják be. Mennyi (közelítőleg) a csapa- 
dékmérések sorozatának mint forrásnak az entrópiája? 
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2/3 2/3 


Í78 


2.6. feladat (A L1l0oyd-Max-algoritmus nem optimális). Mutasson példát arra, 
hogy a L1loyd-Max kvantálótervező algoritmus nem mindig a minimális torzítású 
kvantálóhoz konvergál. Azaz adjon meg egy olyan , rossz" sűrűségfüggvényt és 
kiindulási kvantálót, hogy az algoritmus biztosan ne az optimumhoz konvergáljon. 


2.7. feladat (Maximális differenciális entrópia). Mutassa meg, hogy 


e az adott várható értékű, nemnegatív valószínűségi változók között az expo- 
nenciális eloszlásúnak maximális a differenciális entrópiája; 


PZNZA 


e az [a,b] intervallumon kívül nulla sűrűségfüggvényű valószínűségi válto- 
zók között az la, b]-n egyenletes eloszlásúnak maximális a differenciális 
entrópiája. 
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2.8. feladat (Maximális entrópia). Tekintsük a természetes számok halmazára 
koncentrálódó, m várható értékű diszkrét eloszlásokat. Mutassa meg, hogy a geo- 
metriai eloszlásnak maximális az entrópiája. 


2.9. feladat (Differenciális entrópia). Legyen X abszolút folytonos eloszlású va- 
lószínűségi változó, és jelöljük H(X)-szel a differenciális entrópiáját. Mutassa 
meg, hogy bármely a - 0 számra 


H(aX) — H(X) 7-loga. 


3. fejezet 


Csatornakódolás 


4 


Ebben a fejezetben a zajos csatornán történő megbízható információátvitel prob- 
lémájával foglalkozunk. 


Tekintsük az 1.1. ábrán látható hírközlési modellt. Célunk a forrás által kivá- 
lasztott üzenetet a nyelőbe eljuttatni. Felhívjuk a figyelmet arra, hogy valóságos 
hírközlési problémák vizsgálatánál nem mindig egyértelmű, hogy hol kell a kó- 
dolót és a csatornát, illetve a csatornát és a dekódolót szétválasztani, azaz, hogy 
az esetleg jelenlévő modulátort és a demodulátort a csatorna avagy a kódoló, il- 
letve dekódoló részének tekintsük-e. Ebben a fejezetben, mint látni fogjuk, csak 
az ún. diszkrét csatornával foglalkozunk, vagyis a modulációt és a demodulációt 
a csatorna részének tekintjük. Ez annak a tervezői szemléletnek felel meg, amely 
szerint a modulátort és demodulátort nem akarjuk, vagy nem tudjuk megváltoz- 
tatni. 


Alapvetően két problémával kell szembenéznünk. Az egyik az, hogy az átvivő 
közeg — a csatorna — bemeneti ábécéje nem feltétlenül egyezik meg a forrásábé- 
cével, a másik pedig az, hogy az átvivő közeg zajos, azaz a csatorna bemenetére 
adott szimbólum nem feltétlenül egyezik meg a csatorna kimenetén megjelenő- 
vel. Ezen nehézségek legyőzésének eszköze a csatornakódolás, amelynek elvi 
lehetőségeit a csatornakódolási tétel mutatja meg. 


A zajos csatornát jól modellezi az a feltevés, hogy a csatorna bemenetére adott 
üzenet egyes szimbólumai bizonyos valószínűséggel meghibásodhatnak. 


A csatornakódolás alapvető problémája az, hogy hogyan lehet egy megbízha- 
tatlan eszközön (zajos csatornán) üzenetet nagy megbízhatósággal átküldeni úgy, 
hogy minél jobban kihasználjuk a csatornát. Megmutatjuk, hogy a kihasználtság- 
nak van egy elvi határa, ez a csatornakapacitás. Mivel a dekódolásnak egy fontos 
komponense a döntés, ezért a fejezetet az optimális döntéssel kezdjük. 
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3.1.  Bayes-döntés 


A gyakorlatban gyakran előforduló feladat, hogy egy A paraméter értékét nem 
tudjuk közvetlenül megmérni, csupán egy megfigyelt X mennyiség értékéből sze- 
retnénk A-ra következtetni. 

A számunkra érdekes esetek matematikai modellje a következőképpen fogal- 
mazható meg: 

Legyen X valószínűségi változó, amely értékeit az X halmazból veszi fel va- 
lamilyen eloszlás szerint. (X lehet véges vagy végtelen halmaz, például X — IRJ 
esetén X értéke egy d-dimenziós vektor, vagy X — (0, 17 esetén d-hosszúságú bi- 
náris vektor.) A véletlen A paraméter az A halmazból veszi fel értékét. Azt, hogy 
X megfigyeléséből A értékét próbáljuk meghatározni, egy G : X — A függvénnyel 
írhatjuk le. G(X)-et következtetésnek nevezzük. Ezen belül két esetet különböz- 
tethetünk meg: 


e ha G értékkészlete véges halmaz, akkor G(X )-et döntésnek, 
e ha G értékkészlete végtelen halmaz, akkor G(X)-et becslésnek 


nevezzük. 

Természetesen következtetésünket valahogy minősíteni szeretnénk, ezért de- 
finiáljuk az ún. költségfüggvényt: C : A x A — R, itt C(A, G(X ) ) értéke adja meg 
a következtetés jóságát abban az értelemben, hogy minél kisebb a C értéke, annál 
jobbnak tekintjük a következtetést. Ezért C-t szokás jósági kritériumnak, hasonló- 
sági kritériumnak, vagy megbízhatósági kritériumnak is nevezni. Természetesen 
C(A, G(X ) ) maga is valószínűségi változó, hiszen értéke függ X és A értékétől. 

A költségfüggvény csupán X és A egy-egy konkrét értéke esetén minősíti a 
következtetést, magát a G következtetésfüggvényt ennek várható értékével jelle- 
mezhetjük. 

Az R(G) — E(C(A, G(X))) (csak G-től függő) mennyiséget globális kocká- 
zatnak nevezzük. 

Tekintsük a következő szituációt: 


e legyen az X megfigyelés valószínűségi változó, amely értékeit az X hal- 
mazból veszi fel, és nézzük először azt a speciális esetet, amikor X diszkrét, 
tehát véges vagy megszámlálhatóan végtelen halmaz; 


e az A paraméter szintén valószínűségi változó, értékeit az A — (a1, . . . ,as b 
véges halmazból veszi fel (ekkor természetesen a G(-) következtetésfügg- 
vény értékkészlete is az A halmaz), legyen továbbá az A eloszlása a követ- 
kező: ag; — P(A — a;). 
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3.1. definíció. A H; — (A — a;) eseményt i-edik hipotézisnek, míg a g; valószí- 
nűségeket a priori valószínűségeknek szokás nevezni. 


3.1. példa. Tekintsünk csak egy speciális költségfüggvényt: 


1, hai2zj 
C(anaj)—0j-1-8y— ( 0 egyébként 


Vizsgáljuk meg, hogy alakul ekkor a globális kockázat értéke: 
R(G) — KILEKÉS G(X))) — 


VERA a X) — a; jC(a;, aj) — 


II 
1 KÉS 


ta 


- $Éra- aan G(X) — aj (1 — őr) — 


s 1 P(A— a G(X) — a) — 
s. 1-P(A — G(X) — 
— P(AZG(XI 


Láthatjuk tehát, hogy a költségfüggvény fenti választása esetén a globális koc- 
kázat éppen megegyezik a hibavalószínűséggel. A továbbiakban csak a hibava- 
lószínűséggel foglalkozunk. 


3.2. definíció. A P(A — a; ] X — x) feltételes valószínűségeket a posteriori va- 
lószínűségeknek nevezzük, és P;(x)-szel jelöljük őket. 
Nevezzük döntési tartományoknak az X halmaz azon D ; részhalmazait, amelyek 
bármely elemének megfigyelésekor az a ;-re döntünk: 


D;— (f(x: G(x) — aj), JELTZ 


Láthatjuk, hogy a G döntésfüggvényt teljesen meghatározzák a Dj döntési 
tartományok, vagyis a döntési tartományok megadásával magát a döntést is meg- 
adtuk. 

Válasszuk a j-edik döntési tartományt, D/-ot olyannak, hogy minden x € DÍ 
esetén Pj(x) 2 P(x) teljesüljön minden i -£ j-re, azaz az x pont akkor eleme a 
J-edik döntési tartománynak, ha az x megfigyelés esetén az (A — a;j) hipotézis 
feltételes valószínűsége a legnagyobb. Választhatjuk a Dj tartományokat páron- 
ként diszjunktaknak például úgy, hogy amennyiben valamely x-re a maximum 
nem egyértelmű, azaz, ha ebben a pontban több P; függvény is maximális, akkor 
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x-et az ezek közül legkisebb indexűhöz tartozó D/ tartományba soroljuk. Ekkor a 


döntésfüggvény: 


G"(x) — a;, ha x c Df . 


Ezt a döntést Bayes-döntésnek vagy maximum a posteriori döntésnek nevezzük. 


3.1. tétel. Az így definiált G" döntésfüggvény optimális, vagyis ennek a döntés- 
nek legkisebb a hibavalószínűsége. 


BIZONYÍTÁS: Legyen G(x) egy tetszőleges döntésfüggvény (D; ) döntési tarto- 


mányokkal. Ekkor 


R(G) 


IV 


P(A 7 G(X)) — 


Hz ELEVE )) — 
1-EP(A — aj, G(X ) — a; ) — 








1- EP — aj, G(X ) — a; IX —x)P(X — x) — 
1 Eho] )—aj P(A — a; [X —x)R(X — x) 

7 FElsepP(9P(K —x)2 
1 EE Teny max la JGJR(X — x) — 
1 E (menPje9 ) PGY — a — 
1— Tés (max (x )) P(X — x) — 

tal: x 

1— Even Pt9P(x -x) — 
P(A 7 G"(x)) — 
R(G"). a 


Az a posteriori valószínűségek a következő alakba írhatók: 





P(x) P(A di ] X x) 





P(A SX -xl Kő. 
P(X—-x) 
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P(A — a; jP(X —x IA — aj) 
P(X —x) Ni 
P(X —xy 





ahol p;(x)-szel az X feltételes eloszlását jelöljük az (A — a; feltétel mellett. Lát- 
szik, hogy a P;(x) a posteriori valószínűség ugyanarra az i indexre veszi fel a maxi- 
mumát, amelyre g;p;(x). Amennyiben az a priori valószínűségeloszlás egyenletes, 
azaz gi; — 5 minden i-re, akkor a Bayes-döntés a következőképpen alakul: 


x e Dj, ha pj(x) — max pi(x). 


Az ilyen típusú döntést maximum-likelihood döntésnek nevezzük. 


MEGJEGYZÉS: Maximum-likelihood döntést általában olyan esetekben hozunk, 
amikor az a priori valószínűségek nem ismertek. Ilyenkor az A halmaz azon ele- 
mére döntünk, amellyel mint feltétellel a mért értéknek legnagyobb a feltételes 
valószínűsége. 


3.2. példa (Dekódolás bináris szimmetrikus csatorna kimenetén). Ebben az 
esetben az A — (41, . . . An) valószínűségi változó értékei bináris, n hosszúságú 
kódszavak. Jelöljünk egy kódszót e;-vel, ahol c; — (Ci; , Ci, , . . . , Ci, ), vagyis az i- 
edik kódszó j-edik bitje c;j. A kódszavakat egy Zajos, bináris szimmetrikus csa- 
tornán továbbítjuk, melynek kimenetén az X — XI, . . . , Xa valószínűségi változó 
(szintén n hosszúságú bináris sorozat) jelenik meg. Az X eloszlását abban az 
esetben, amikor a továbbított kódszó c; volt, a csatorna p átmenetvalószínűsége 
határozza meg a következőképpen: 


P(X —x1,x2,..., Xn IA — ej) — 
P(Xi — xi, X2 — x2, . . . Xn — Xn I Ai — Ci, ... An — ci) — 
P(XI — xi [Ai — cg )HP(X2 — x2 [42 — cp] 
P(X. — xn [An — Ci, )- 














Ez az egyenlőség definiálja az emlékezetnélküli csatornát, vagyis a j-edik kime- 
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neti szimbólum eloszlása csak a j-edik bemeneti bit értékétől függ. Az, hogy a 
csatorna átmenetvalószínűsége p (0 a p € 1/2), éppen azt jelenti, hogy 


( D, ha xx A Ci 


1—p, haxp— ci 


P(X, 7 Xk I Ak 7 Ci) 7 


perc) (1 — pp) eft ee. 


Iazciy 

P kT ik 
E et 1— p). 
(5) (1—p) 
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Ezért tehát 








I n Pp Ize) 8 
P(X—x]A—c) Úr) 1-9] - 


EI Fé i 
P KI kT cik 5 
zep tjfe 1—py. 
(5) (1— p) 


Amennyiben a csatorna X kimenete ismeretében a csatorna bemenetére adott 
kódszót maximum-likelihood döntés segítségével akarjuk meghatározni, azt a C;-t 
n 


választjuk, amelyre pi(x) —P(X — x] A — c; ) maximális, azaz amelyre ? [x4c,) 
k—I 
minimális (hiszen Eg a 1. 
n 
Vegyük észre, hogy Y I buzci) éppen az x és a cz Hamming-távolsága, ami azt 
k—1 


jelenti, hogy bináris szimmetrikus csatorna esetén a maximum-likelihood dekó- 
dolás éppen a csatorna kimenetén vett sorozattól minimális Hamming-távolságra 
levő kódszó választását jelenti. (Két egyenlő hosszú bináris sorozat Hamming- 
távolságán azon bitek számát értjük, amelyekben a két sorozat különbözik.) 


Amennyiben az X megfigyelés értéke valós, és f(x) az eloszlást meghatározó 
sűrűségfüggvény, továbbá f(x) — f(x] A — a; ) az A paraméter a; értékéhez tartozó 


feltételes sűrűségfüggvény, akkor bebizonyítható, hogy az a posteriori valószínű- 
ségfüggvények a következő alakba írhatók: 


.. gifik) 
f(x) 


Látszik, hogy ez az eset formailag teljesen analóg a diszkrét esettel, ezt a 
következő példával szeretnénk érzékeltetni: 

Tegyük fel, hogy minden egyes x € R számra csak azt tudjuk megfigyelni, 
hogy az X valószínűségi változó A/2 sugarú környezetébe esik-e, azaz, hogy 
bekövetkezett-e a BA — X € (x— A/2,x 4 A/2) esemény. Tegyük fel továbbá, 
hogy f, fi, . . . , fi; folytonos függvények. Ekkor a BA-hoz tartozó a posteriori va- 
lószínűségek: 


P(x) 





PP(x) — P(A—a;]Baj— 
P(A - a;, BA) 2 
PíBAY 


P(A — a; YP(BA IA — aj) 
P(BA) E 
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Az fi-k folytonossága miatt alkalmazhatjuk az integrálszámítás középértéktételét, 
amiből 

lim Pá) — 1 

AG0 fe) 


Látszik tehát, hogy egyre kisebb A esetén aszimptotikusan a maximum a posteriori 
döntés a következő alakú: 





G(x) — maxag:i fi(x), 


ekkor 
Di — (x: G(x) — gi fi (2) ). 


Megmutatjuk, hogy ez tényleg optimális döntés. 
§ 
R(G) — 1—-)YP(A — ai, G(X) — aj) — 
i—1 


— 1-FP(XEDI14 — aj] P(A — aj) — 


i—1 
Hi 12Y f iget 
2 [figdxa 
cs ey RÁK 
pYk x2 


§ 


VAz [data elése 


IV 


sz 1— max (gj.fj(x) )áx — 
TR4 
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gifi(x) 
gfelx) 





Di DI 
3.1. ábra. A Bayes-döntés hibavalószínűsége. 
§ 
— 1-Y / maxtayfj9 ) dx — 
i— 7 
§ 
— 1-E / fix) dx — RG"). 
i—1 
f ő jú 


A fenti levezetés alapján kiszámíthatjuk a Bayes-döntés hibavalószínűségét: 
R(GY—1— f max tafj(x) Já. 
TR4 


s — 2 esetén 


R(G") — J min (gi.f1(x) , g2f2(x) ) ax, 
TRd 


amelyet a 3.1. ábra szemléltet egy dimenzióban. 


3.2. Optimális detektálás analóg csatorna kimenetén 


A következő szituációt vizsgáljuk: legyen a Z1, 2 , . . . stacionárius forrás olyan, 
hogy Z; értékeit az A — (a1,a2, . . . , as) halmazból veszi, és ezeket az értékeket 
(üzeneteket) egy analóg csatornán kell továbbítanunk. Ezt az analóg (fizikai) csa- 
tornát úgy modellezzük, hogy az idő T hosszúságú szeletekre van osztva, és az 
i-edik szeletben a Z; betű átvitelére kerül sor úgy, hogy a lehetséges aj, . . . , a; 
betűknek megfeleltetünk [0, T]-n értelmezett y1(z), . . . , vs (t) függvényeket (jelala- 
kokat), és ha Z; — a, akkor az [(i— 1), ir] intervallumon az ya(t — (i— 1)T) jelet 
küldjük el. Ezt a technikát digitális modulációnak nevezzük (3.2. ábra). 


3.2. OPTIMÁLIS DETEKTÁLÁS ANALÓG CSATORNA KIMENETÉN 


PAM: 
y1 





ela je 


BPSK: 
állle 
0 ST 


OPSK: 











ják s 
ZA 
üg sz 


BF—- 








Flt 





ea 
ön MNNÉS ét 
Ms JT 











me 
Fi uz 


3.2. ábra. Digitális moduláció. 
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3.3. példa. PAM (impulzus amplitúdómoduláció, pulse amplitude modulation): 


yi(t) —airy(t), i— 12. 


3.4. példa. BPSK (bináris fázismoduláció, binary phase shift keying): 


yi(t) —sin(t3-(i—1)7), 


i—1,2. 
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3.5. példa. OPSK (kvadratikus fázismoduláció, guadratic phase shift keying): 
; ; n ; 
vi(t) — sin (115), i—1,2,3,4. 
3.6. példa. BFSK (bináris frekvenciamoduláció, binary freguency shift keying): 
yi(t) — sin((wo 3 (i—1)A)t), i— 1,2. 


A csatorna bemenetére adott jel tehát a következő: 


009 - E sz(r—G— 19. 


1——o0o 


Feltételezzük, hogy az analóg csatorna additív zajos, ami azt jelenti, hogy a 
kimenete 


V()—UG)--N(), 


ahol az N(t) egy 0 várható értékű stacionárius sztochasztikus folyamat. Feltesz- 
szük, hogy a csatorna kimenetén ismerjük a T hosszú időszeletek határait, azaz a 
szinkronizálást már elvégeztük. Az egyszerűség kedvéért tekintsük a döntést Z1- 
re, azaz V(t)-t megfigyeljük a [0,T] intervallumon, abból 5 időközönként mintát 
veszünk, és a minták alapján döntünk. Ekkor 


(v 6) aj () eV) 2 
ba 6) yZ G) sZ m) -k 
(v 6) ,N B) Nt ) éz; 


ss ryYzi 3 N, 


X 


ahol y; jelöli az y:(z) mintáinak és N az N(t) mintáinak a vektorát. Ha f(x) jelöli 


az N sűrűségfüggvényét, akkor az y; 1-N sűrűségfüggvénye 


Ji(x) — f(x — yi), 


tehát a Bayes-döntéshez a 


ai f(x) — ai f(x —yi) 
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értékeket kell i-ben maximalizálni. Nézzük a továbbiakban azt a speciális esetet, 
amikor s — 2, gi — g2 — 3, és az N(t) egy 0 várható értékű stacionárius Gauss- 
folyamat. Ekkor az N(t ) folyamat N mintáinak vektora normális eloszlású 0 vár- 
ható értékkel és K kovarianciamátrixszal, azaz 


f(x) —-————— e7 tek), 


(v2m)" v/detk 





tehát 
fil) - —7—— etre ttr9), 
(v2n) v/detk 
(a, b) alakban a skalárszorzatot jelöltük. 
A hibavalószínűséget a Bayes-döntés minimalizálja, azaz 


Di — (f(x: nfi(x8) 2 nfolx)) — 
— (x: f(x—y1) 2 f(x—y2))— 
— (x: Inf(x—y1) 2 Inf(x—y2)) — 
— (x: (x—yi KT (x—yi)) S (x—y2 KT (x—y2))) — 


— (x: (x.Kx)— (ya. x)—(xKy) Tt (yKy) S 
(x,Kx) — (y2. KT x) — (x,K ya) (y2.K ya) 


K-! szimmetriájának felhasználásával: 


— (x: —2(x Ky)r(y.Ky) e 
—2 (x,K71y2) 4 (y2.K yo) 


II 
A 
v4 
ÉRÉS; 
la 
4 
Más 
IA 
a 
s 


ahol 
v—-K-(ya—-yi) 


1 
Ci 7 7 ((y2.Ky2)— (ya.Ky1)) 


Látszik tehát, hogy ebben az esetben a Bayes-döntés rendkívül egyszerűen 
megvalósítható, amennyiben ismerjük az additív Gauss-zaj kovarianciafüggvé- 
nyét. Az is látszik, hogy a döntési tartományok határa egy affin hipersík (eltolt 
altér). A 3.3. ábrán látható optimális detektálást végrehajtó eszközt a híradástech- 
nikában diszkrét korrelációs detektornak nevezik. 
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3.3. ábra. Diszkrét korrelációs detektor. 


3.3. Csatorna, csatornakapacitás 


A diszkrét csatorna leírható a bemeneti ábécével, a kimeneti ábécével, illetve az 
átmenetvalószínűségekkel. Az U bemeneti, és a V kimeneti ábécék legalább két- 
elemű véges halmazok. A csatorna egyenletes időközönként a bemenetére adott u 
szimbólumra (amely a bemeneti ábécé eleme) a kimenetén a kimeneti ábécé egy 


v elemét adja válaszul. A csatorna viselkedését a bemenőjelek UI , U7 , . . . , Un, . . ., 
illetve a kimenőjelek Vi , V2 , . . . , Va sorozata írja le; ezen valószínűségi változók 


együttes eloszlása: 


P(VI — vi, . . . Va — Vn, UL — ui, . . . Un — un) — 
— P(U. — u, . .. Un — unk 
P(VI — vi, ..., V4 — va 1 U1 — 1, . ... Un — unh 


ahol P(Ui — ui, ..., Un — un)-et a forrás eloszlása és a kódoló együttesen hatá- 

rozzák meg, míg a PíVi — vi, . . . , Va — Va ] U1 — ui, . . ., Un — un) feltételes való- 

színűségek (n — 1, 2, . . .) a csatornát leíró ún. átmenetvalószínűségek. 

MEGJEGYZÉS: Azt mindig feltesszük, hogy a csatorna nem szinkronizációhibás, 

vagyis, hogy a kimenetén pontosan annyi szimbólum jelenik meg, amennyi a be- 

menetére került, tehát szimbólum nem vész el, és nem is keletkezik fölöslegesen. 
Az egyszerűség kedvéért vezessük be a következő jelöléseket: 











p(v,u) Pí(V-v U-ul 
- P(VI — vi, . . . , Va — Vn, UL — ui, . .. Un — un) 
p(u) P(U- uj 
sz P(Ui — ui, . . . Un — unt 
p(v) P(V — vi 
za P(VI —vi,..., V4— va) 
p(v]u) P(V-v]U-—ul 
— Pf(VI —vi,...,V4— va 1 U1 — 1... Un — unh 
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illetve 
P(Vi, ui) P(V; — vi, U; — uj) 
Pu) — P(U:— ujj 
PV) — R(Vi—vij 
;) 


P(V; 7 V; ] U; tesi uj) 
Most definiáljuk a diszkrét memóriamentes csatorna fogalmát: 


3.3. definíció. Egy csatornát akkor nevezünk diszkrét memóriamentes csatorná- 
nak, ha a p(v ] u) átmenetvalószínűségek minden n-re, u € U"-re és v € V"-re 


kielégítik a következő egyenlőséget (U" és V" az U ill. V elemeiből alkotható 
n-hosszúságú sorozatok halmazát jelöld): 


n 


p(v]uj—[ [D6 I 4, 


i—1 
azaz a csatorna kimeneti szimbólumának eloszlása mindig csak az aktuális beme- 
nettől függ. 


Nézzünk meg példaként néhány fontos diszkrét memóriamentes csatornát. 


3.7. példa (Bináris szimmetrikus csatorna (BSC)). Ezzel a csatornatípussal 
már foglalkoztunk a 3.2. példa kapcsán. Itt mind az U bemeneti, mind a V ki- 
meneti ábécé kételemű (U — V — (0, 1)), az átmenetvalószínűségek pedig: 








P(V—11U—0)—Pf(V—01U—1)—p 
P(V—1]1U—1)—Pf(V—0]JU—0)—1—p. 








Az átmenetvalószínűségek a 3.4. ábrán látható módon ábrázolhatóak. 


3.4. ábra. Bináris szimmetrikus csatorna. 
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1—p 
3.5. ábra. Bináris 2-csatorna. 


3.8. példa (Bináris z-csatorna). Ennek a csatornatípusnak a bemeneti és kime- 
neti ábécéje szintén kételemű (bináris), azonban ez a csatorna nem szimmetrikus, 
a bemenetére adott , 07 szimbólumot egy valószínűséggel hiba nélkül továbbítja, 
csupán az ,, 1" szimbólum továbbításánál hibázhat p valószínűséggel, azaz 








P(V—-0]U—0) 1, 
P(V-0O]JU—-1) D, 
P(V-—-1]U—1) 1—p 














(lásd 3.5. ábra). 


3.9. példa (Bináris törléses csatorna). A bináris törléses csatorna bemeneti ábé- 
céje U — (0,1), míg a kimeneti ábécé tartalmaz egy további speciális szimbólu- 
mot is: V — (0, 1, x). Hibázáskor mindig a ,,x" szimbólum jelenik meg a csatorna 
kimenetén: 


P(V—-:1U-01j—-Pí(V-:]U-—1j—p 
P(V-11U—1)—P(V—-0]1U—0)—1-—p 














(lásd 3.6. ábra). 


A diszkrét memóriamentes csatornák jellemzésére vezessük be a csatornaka- 
pacitás fogalmát: 


3.4. definíció. A p(v; I u:) (vi; c V, u; c U) átmenetvalószínűségekkel leírt diszk- 
rét memóriamentes csatorna C csatornakapacitása a következő: 


C — max (I(U;V)), 
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jelzet 4 0 
P 
j 
P 
Ke 1 


3.6. ábra. Bináris törléses csatorna. 


ahol a maximumot az összes olyan (U, V ) valószínűségi változópár halmazán kell 
képezni, ahol U a csatorna U bemeneti ábécéjén, V pedig a V kimeneti ábécén 
veszi fel értékeit, továbbá együttes eloszlásuk kielégíti a PÍV — v; [ U — u;t 
P(vi I u:) egyenlőséget, azaz V tekinthető a csatorna által U-ra adott válasznak. 
Ekkor 








LG man 98 pi be eg 7 


ue u vev 





b; p(v]u) 
seas MORE HSS OG a) 


ueu 


I 
3 
54 


Láthatjuk tehát, hogy a maximumot elég a csatorna bemeneti ábécéjén definiál- 
ható p(u) (u c U) eloszlásokon képezni. 


MEGJEGYZÉS: A csatornakapacitás definíciójában azért írhattunk maximumot 
szuprémum helyett, mert az I(U; V ) egy folytonos függvény a p(u) (u € U) elosz- 
lások zárt, korlátos halmazán, ezért biztosan van olyan bemeneti eloszlás, hogy a 
bemenet és a kimenet közötti kölcsönös információ eléri a csatornakapacitást. 

A csatornakapacitás intuitív jelentése tehát a , csatornán maximálisan átvihető 
információ mennyisége". Tulajdonképpen ennek az állításnak a pontos megfogal- 
mazását adja a későbbiekben tárgyalandó csatornakódolási tétel. 

Példaként számoljuk ki a 3.7. példában szereplő bináris szimmetrikus csatorna 


kapacitását: 


3.10. példa. Esetünkben a bemenet eloszlása egyetlen c paraméterrel jellemez- 
hető: 
P(U-—-—0j—a; P(U-—-11—1—a. 
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Ekkor a csatornakapacitás: 
C — maxI(U;V) - max (H(V ) — H(V 1 U)). 
Könnyen látható, hogy 
H(V ]1U) —h(p) ——plogp—(1—p)log(1— p) 
független U eloszlásától, ezért elég 
H(WV)—h(a(1—p)4(1—0)p) 


maximumát keresni. Tudjuk, hogy a h(x) függvény az x — 5 helyen veszi fel a 
maximumát, ezért H(V) akkor maximális, ha o0(1— p) 1-(1—a)p — 3, azaz ha 
a — 2. tehát egyenletes a bemenet eloszlása. Ekkor tehát 


C-1og2—h(p)—1—h(p). 


Látszik, hogy a csatornakapacitás p—O és p— 1 esetén C— 1, p — ; esetén 
C — 0, továbbá, hogy a csatornakapacitás a p átmenetvalószínűség alulról konvex 
függvénye. 


3.4. Csatornakódolási tétel 


Definiáljuk most az 1.1. ábra hírközlési modelljének többi blokkját is. 


3.5. definíció. Csatornakódnak nevezzük az U" egy M elemű C — £(€c1,...,cmhb 
részhalmazát, amelynek elemei a c; — c; , . . . , cs, kódszavak (ci, € U, i — I, . . . , M, 
J—l[;.... 


3.6. definíció. A kódoló egy invertálható f : y" 5 (ei, .. .,cw) függvény, amely 
a forrás k hosszúságú blokkjaihoz kódszavakat, vagyis a csatorna bemeneti ábé- 
céjének elemeiből alkotott n hosszúságú sorozatokat rendel: 


Fra el e ük 


3.7. definíció. A dekódoló két független részre bontható, döntőre és a kódoló 
inverzére (lásd 3.7. ábra). 

A döntőt a g : V 6 (€1,..., cm) leképezés adja meg, azaz a csatorna kime- 
netén megjelenő n hosszúságú blokkokhoz rendel hozzá kódszavakat. A döntést 
definiálhatjuk a DI , . .. Dum C V" döntési tartományokkal is a következőképpen: 


Dn—-(veV" : 2(vV)—enk m - 1,2,...,M. 
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—— dekódoló z döntő kódoló"! [F— 





























3.7. ábra. A dekódoló felépítése. 


A kódoló inverze egyszerűen az f kódolófüggvény f-! inverzét jelenti, ez a döntő 
kimenetén adódó kódszóhoz hozzárendeli azt az üzenetet (azaz a forrás k-hosz- 
szúságú blokkját), amelynek kódja éppen ez a kódszó. 


Most tekintsük át a csatorna megbízhatóságának mérőszámait. 


3.8. definíció. Tegyük fel, hogy M számú üzenet valamelyikét akarjuk továbbí- 
tani (például bináris forrás k hosszúságú blokkjai esetén M — 2"). Jelöljük ezeket 
Y1,:..,Yym-mel. Adott kódoló és dekódoló esetén annak a valószínűsége, hogy a 
dekódolás hibás, feltéve, hogy az yYm m-edik üzenetet továbbítottuk: 


Pem — )3 P(y IYm) — pa p(y IYm). 


JG) EYm y ÉDmn 


Így, ha p(ym) az m-edik közlemény előfordulásának valószínűsége, akkor a hibás 
dekódolás valószínűsége: 


M M 
Fe — ) P(Ym) Perm sz ) ba P(Y Ym). 
m-Il m-ly £Dn 


A P, hibavalószínűség tehát függ a közlemények eloszlásától. Mi olyan kódolást 
szeretnénk azonban, amely ettől függetlenül jó, ezért vezessük be a 


27, y 
Fe — — Pe 
M zi 
átlagos hiba kifejezését. P, értéke független az üzenetek eloszlásától. 


MEGJEGYZÉS: Ha P, minimalizálása a célunk, akkor mint a 3.1. szakaszban lát- 
tuk, azt a Bayes-döntés megteszi. Ez azt jelenti, hogy a dekódoló azt az Ym köz- 
leményt választja ki, amelyre az Yym feltételes valószínűsége maximális a csatorna 
kimenetén megjelenő y/ sorozattal mint feltétellel. P, minimalizálása megfelel a 
hibavalószínűség minimalizálásának egyenletes a priori eloszlás esetén. Ekkor az 
optimális döntést maximum-likelihood döntésnek nevezzük. Ebben az esetben a 
kódoló—-dekódoló párt a kódszavak (€i] , . . . , w ) halmazával teljesen megadtuk. 

Tekintsünk egy rendkívül egyszerű példát annak illusztrálására, hogy csator- 
nakódolással hogyan növelhetjük meg az átvitel biztonságát. 
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3.11. példa. Tekintsük a 3.7. példában ismertetett p hibavalószínűségű bináris 
szimmetrikus csatornát. Kódolás nélkül a hibázás valószínűsége nyilván: 








Pe Pen Pe2 P, DP. 


Vegyük most a következő kódot: C — (000,111), vagyis M—2,n—3,k—l, 
illetve a kódolási szabály: f(0) — 000; f(1)— 111. Ha a dekódolási szabály a 
többségi döntés, azaz akkor és csak akkor dekódolunk ,,17-est, ha a vett három bit 
között legalább két ,,17-es van, akkor könnyű látni, hogy a hibavalószínűségek: 








P/ —P, —P, 2 — PI —3p" —2p?, 
amely p 2 5) esetén sokkal kisebb, mint a kódolás nélkül elérhető hibavalószínű- 
ség. 

Az előző példában láthattuk, hogy a hibavalószínűség csökkenéséért árat kel- 
lett fizetnünk: az üzenetek leadásához háromszor olyan hosszú időre volt szüksé- 
günk. Definiáljuk tehát a jelsebesség fogalmát. 


3.9. definíció. Jelsebességnek vagy kódolási sebességnek nevezzük az R — 
értéket. 


logM 
n 


A jelsebesség mértékegysége bit/csatornahasználat, ami a csatorna kihasznált- 
ságát méri. Azt jelenti, hogy egy csatornahasználattal hány bit üzenetet viszünk 
át. 


3.12. példa. Bináris forrás k hosszúságú blokkjainak kódolása esetén a jelsebes- 
4 k 
ség R— 5. 


Olyan kódot szeretnénk készíteni, hogy egyidejűleg P, kicsi, az R jelsebesség 
pedig minél nagyobb legyen. Az a kérdés, hogy megfelelő kódolással és dekó- 
dolással milyen maximális jelsebesség érhető el, ha az átvitel hűségével szemben 
támasztott követelmény: P, c €, ahol € 5 0 adott hibakorlát. A következőkben 
tárgyalandó csatornakódolási tétel, illetve annak megfordítása azt a meglepő tényt 
mondja ki, hogy tetszőleges €-ra ez a maximálisan elérhető jelsebesség független 
€-tól, és megegyezik a csatornakapacitással. 

Először azt a kérdést vizsgáljuk, hogy adott R — pet jelsebesség mellett mi- 
lyen kicsi lehet a dekódolás hibavalószínűsége. Jelölje az Y valószínűségi változó 
a továbbítandó üzenetet, mely M különböző értéket vehet fel. A kódoló után az 
f(Y)—C— (Ci, . . . , Cn) kódjelsorozat jelenik meg — ez a csatorna bemenete —, 
míg a csatorna kimenete a V — (VI, . . . , V,) jelsorozat. A dekódolás eredménye 
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az f-1(g(v)) — Y visszaállított üzenet, ahol g a döntőfüggvény. A dekódolás 
hibájának valószínűsége: PfY A 1] SB. 

A csatornakódolási tétel alábbi megfordítása a P, átlagos hibavalószínűségre 
ad alsó becslést. 


3.2. tétel (A csatornakódolási tétel gyenge megfordítása). A C kapacitású diszk- 
rét memóriamentes csatorna minden R jelsebességű és n szóhosszú kódjára 


3.1. következmény. Ha R - C, akkor liminf Pe 5 0, azaz ha n elég nagy, akkor 


nem készíthető olyan kód, amelyre a dok ódolás hibakorlátja tetszőlegesen kicsi. 
Mielőtt rátérnénk a bizonyításra, egy önmagában is érdekes lemmát látunk be. 


3.1. lemma (Fano-egyenlőtlenség). Tegyük fel, hogy az X és az Y valószínű- 
ségi változók értéküket ugyanabból az M elemű halmazból veszik fel. Ha P, — 
pa 1 p(x,y) annak a valószínűsége, hogy X £ Y , akkor 


x y2 Xx 
H(X IY) £ P.log(M—1)--h(P)), 


ahol h(x) a bináris entrópiafüggvény. 


BIZONYÍTÁS: Bontsuk fel a feltételes entrópia kifejezését két részre: 


DG) 
hl ú 


EE pteyjtog éb y,y PO) . 


szősyzi p(x 8 pWy) 





H(XIY) — 2.2.P(wy)log 





Először az első tagot vizsgáljuk. Mivel 


EXr9-EU1- pe) me 1, 


x yÁx x 


a Jensen-egyenlőtlenség 1.2. következményéből következik, hogy 








M — 
YVpxy)log- po) .£ Pelog P 


1 1 
— Pe.log(M—1)- Pelog —. 
Xx yAx p(x, y) P. 
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A második tag: mivel E p(y,y) — 1 — Pe, ezért szintén az 1.2. következményből: 
y 








os PE asse 
2.pos)! Ej EVET 


amivel az állítást beláttuk. HI 


A 3.2. TÉTEL BIZONYÍTÁSA: A kölcsönös információ tulajdonságaiból (2.8. 
d)-ből) következik, hogy az Y üzenet és a dekódolt Y kölcsönös információja: 


IGY;Y) — IGY): 57 (8(V))) SIX) V) — (CV), 8.1) 


ugyanis az f függvény kölcsönösen egyértelmű. 
Legyen az U — C eloszlása: 


P(U — u) — p(u), u — (1, ... un) EU". 


Ekkor, mivel a csatorna memóriamentes, azaz 
p(v]u) - [I P(vi I u) 


ezért 


H(VIU) — EEPML(v] várejeT es 


u v 


II 
(verődve 


II 
fat 


1 


1 
p(v]u) FoszaT-J ET ő 


1 
u, v) log ———  — 
p( ) B pi] u) 


c 
4 


H(V; I U;) . 


I 
MW: 


II 
za 


Másrészt pedig tudjuk, hogy 


tehát 
I(UV) c $ (r(w) — H(V; ] U;) ) — pi I(UG Vi) £ nC, (3.2) 
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ahol a második egyenlőtlenség a csatornakapacitás definíciójából következik. 

Tegyük fel, hogy az Y valószínűségi változó egyenletes eloszlású, vagyis 
minden üzenet egyformán 17 valószínűséggel kerül átvitelre. Ebben az esetben 
H(Y) — logM, és P, — P,, tehát a Fano-egyenlőtlenségből, (3.1)-ből és (3.2)-ből 
következik, hogy 


B.log(M—1)--h(P.) 2 H(Y.19) —109M—I(Y,Y) 3 logM —nC. 
Felhasználva, hogy log(M— 1) clogM —nk, illetve, hogy h(P.) £ I, 
ő 1 
BR4-2R-—C, 
n 
és ezzel az állítást beláttuk. ha 


MEGJEGYZÉS: A tétel fő következménye az, hogy R - C esetén liminf P, 5 0. 
nao0 
Igaz azonban az ennél sokkal erősebb liminfP, — 1 állítás is, amelynek bizo- 
n—o0 


nyítását itt nem ismertetjük. Ezért nevezik a 3.2. tételt a kódolási tétel gyenge 
megfordításának. 


A következő tételt, amelyet először C.E. Shannon mondott ki, az információ- 
elmélet egyik alaptételének is szokás nevezni. 


3.3. tétel (Csatornakódolási tétel). Tekintsünk egy C kapacitású diszkrét memó- 
riamentes csatornát. Ekkor bármely r  C és € 5 0 számhoz létezik olyan C — 
(€1, . . . em) csatornakód — amelynek kódszavai n hosszúságúak —, hogy 


aP ce 


b) M 52", azaz a pek jelsebesség nagyobb, mint r. 


BIZONYÍTÁS: Legyen £2 — U" x V", azaz az összes olyan (u, v) pár halmaza, 
ahol u — (ui, . . . un) ÉS v — (vi, . . . , Vn) a csatorna bemeneti, illetve kimeneti ábé- 
céjének elemeiből alkotott n-hosszúságú sorozatok. Definiáljunk az £2 halmazon 
egy valószínűségeloszlást a következőképpen: 


p(u,v) — p(u)p(v] u), 


n 
ahol p(v ] u) — II p(v: ] u;), ahol a p(v; I u;)-k a csatorna átmenetvalószínűségei, 
i—1 
n 
továbbá p(u) — II p(u:), ahol p(u) (u c U) éppen az a bemeneti eloszlás, amelyre 
—I 


i7- 
I(U;V) — C (lásd a 3.4. definíció utáni megjegyzést). 
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Legyen most R olyan, hogy r a R — C. Definiáljuk a 7 C £ halmazt a követ- 
kezőképpen: 
T — ((u,v) : ilu v) 3 nR), 
ahol 
p(v]u) 


p(v) 





i(u,v) — log 


az u és v elemi kölcsönös információja. 

A T halmazra gondolhatunk úgy, mint azon (u, v) párok halmazára, amelyek- 
ben u és v bizonyos értelemben , közel vannak egymáshoz", hiszen nagy az elemi 
kölcsönös információjuk. 

Az optimális maximum-likelihood döntés helyett egy másik döntést haszná- 
lunk. A maximum-likelihood döntésnél p(v ] c; )-t maximalizáltuk. Ennél a dön- 
tésnél csak akkor döntünk, ha 


sak 





max p0c 6 
i pl) 
Most tegyük fel, hogy adott egy tetszőleges C — f€1,...,cw) kódunk. A T 
halmaz segítségével — a kód jóságától függetlenül — állapítsuk meg a dekódolási 
szabályt (azaz a döntőt, lásd a 3.7. definíciót) a következőképpen: 
Amennyiben a csatorna kimenetén a v sorozat jelenik meg, tekintsük a beme- 
neti sorozatok következő S(v) C U" halmazát: 





S(vy— (u: (u w eT) 


(amely tehát a v-hez , közel eső" bemeneti sorozatokat tartalmazza). Amennyiben 
S(v) pontosan egy c; kódszót tartalmaz, akkor c;-re döntünk, azaz g(v) — €j. Kü- 
lönben, azaz ha S(v) több kódszót tartalmaz, vagy ha egyet sem, akkor tetszőleges 
kódszóra döntünk, azaz szándékosan hibázunk. 

Láthatjuk, hogy a fenti dekódolási szabály mellett, amennyiben a c; kódszó 
került a csatorna bemenetére, kétféleképpen történhet hiba: ha a kimeneten meg- 
jelenő v sorozatra c; £ S(v), vagy ha valamely i 5 j-re cj € S(v). 

Ezért a feltételes hibavalószínűség felülről becsülhető: 


P,; 2 P(c; 4 S(V) 1U— ej) - ja P(cj e S(V) [U — e/).. 
j—1 
jzi 


A kifejezés jobb oldalát átalakítva: 
Pe S FC —Ir(ev))pívle) HE Ir(ej,v)p(v ] ei) — 
§ JAV 
zi 0:(€e1, . ya , CM); 
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ahol hüje 
; u v) c 
TTÁGYÁSS ( 0, ha(u v]éT 7 

azaz a Pe ; (1 — 1, ..., M) feltételes hibavalószínűségek felülről becsülhetők a kód- 
szavak igen bonyolult 0; függvényeivel. Olyan kódot szeretnénk találni (vagy 
legalább a létezését bizonyítani), amelyre O;(€1 , . . . , w) minden i-re kicsi, ekkor 
ugyanis P, is kicsi. Sajnos a 0; függvények száma és bonyolultsága olyan nagy 
lehet, hogy hagyományos minimalizálási módszerekkel reménytelen , jó" kódot 
találni. Szerencsére azonban létezik egy meglepő technika, amellyel jó kódot ké- 
szíteni ugyan nem tudunk, azonban a létezését be tudjuk látni. Ez a technika az 
ún. véletlen kódolás. Ennek lényege röviden az, hogy a kódszavakat véletlensze- 
rűen sorsoljuk, és az így készített kódra vizsgáljuk a O;(€1, . . .  cw) valószínűségi 
változókat. Meglepő, de kiderül, hogy a O; valószínűségi változók várható értéke 
minden i-re nullához tart, ha M — [27] és n 5 co. Ebből pedig már könnyű lesz 
belátni a kívánt tulajdonságú kód létezését. 

Az első kérdés nyilván az, hogy milyen eloszlás szerint sorsoljuk ki az egyes 
c; — (Ci, ... Cin) (i— 1, ..., M) kódszavakat: Legyen egy € — (€c1,...,cw) kód 


valószínűsége: 
M 


- ITTA Ci), 


P(ci1,...,cm) 7 


z 


II 
ja 


[4 


ahol p(-) az az eloszlás a bemeneti ábécén, Mesa a be- és kimenet kölcsönös 
információja eléri a csatornakapacitást. 

Képezzük most a O0-(C1, . . . , Cw) valószínűségi változó várható értékét a fenti 
eloszlás szerint sorsolt kódra: 


E(O:) 


EIE0— MC) plvI 00] 


FEE] - 


E FEE. 
JAi 


Először E1-et vizsgáljuk: 


Ei - h2 Plész? s-Telérv)) pr [69 


CI ,...,C. HV 


— pc c) p(v I ep) (1—/r(c;,v)) — 


CV 


— Yp(u,v) (1— Ir(u,v)) — 


u v 


- R(UV ÉT, 
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tehát Ej — Pf(i(U, V) a nR), viszont 





i ú jr. pine 7 ké 
i(u,v) — log - 21 72 (uk, Vr). 


(Az itt szereplő eloszlások definíciója alapján gondoljuk át, miért igaz a p(v) — 
n 
JT Pl) egyenlőség) 
Láthatjuk, hogy az i(U, V) valószínűségi változó n darab független, azonos 
eloszlású valószínűségi változó összege, amelyek várható értéke: E(i(Uk, Vr) ) — 
I(U,V) — C. 
Mivel R — C, a nagy számok gyenge törvényéből adódik, hogy 


k—1 


Ü : 
imp(; FT uw en - 


1 n 
—z lim P A — (Uj V.) — Ei(Uk, V, R—C;—-—0 
im (ga k; V) — Ei(Uk, Vg) ) C ) ; 


n3o0 


tehát 
lim P(i(U,V) CnR) —0, (3.3) 


azaz E1 nullához tart, ahogy n tart a végtelenhez. Most megpróbáljuk E? j-t felül- 
ről becsülni. 


Ej —  DY. P(ci...em py ej, v)p(v ] e;) — 
CI ,.. CM 
zi Xp( c) )Ir( (€j,v )2P( c;)Dp (v ] e;) — ze 
Cj,V 
— XP cj)p v)ir( (€j,v ), 


€CjV 


azaz 


E2 j — 9. p(u)p(v). 


(uwjeT 


A T halmaz definíciója szerint, ha (u, v) e T, akkor 
p(up(v) £ plu,v] 2, 


így 
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Összegezve az eredményeket: 


E(2) — EY Ej £ P(i(U,V) c nR)-M27"8, (3.4) 
izj 
Megjegyezzük, hogy E(O;) nem függ i-től. Válasszuk most a kódszavak szá- 
mát M — [277-re. Ekkor M2-"R c 2.2-7(R-"), Mivel r £ R c C, ezért (3.3) mi- 
att a (3.4) kifejezés jobb oldala tetszőlegesen kicsivé tehető, azaz található olyan 
nagy n kódszóhossz, hogy az M — [27] méretű kódokra minden O; várható ér- 
téke: E(O;) ce (i—1,...,M). 


M 
Azt tehát beláttuk, hogy a P, — 17. X Pe; átlagos hibavalószínűség (amely per- 
i—1 


sze a véletlen kódválasztás miatt szintén valószínűségi változó) várható értéke: 


E(P.) c e, 
amiből nyilvánvalóan következik, hogy létezik olyan konkrét kód, a véletlen kód 
egy realizációja, amelyre P, c €. HI 


MEGJEGYZÉS: A csatornakódolási tétel imént bizonyított formája nem mond 
semmit arról, hogy R € C esetén a P, hibavalószínűség milyen sebességgel tart 
nullához, azaz, hogy egy adott € 5 0-hoz milyen szóhosszúságú kóddal érhető 
el €-nál kisebb hibavalószínűség. Itt nem bizonyítjuk, csak megemlítjük, hogy 
létezik olyan eredmény, amely az exponenciális konvergenciasebességet mondja 
ki, pontosabban: 

B, Z e ER)n 


, 


ahol E(R) alulról konvex függvény, és R — C esetén E(R) 5 0. 


3.5. Feladatok 


3.1. feladat (Paritásbit használata visszacsatolásos csatornán). 

A gyakorlatban rendkívül gyakran használt kódolási módszer az, hogy az üzenet 
bináris sztringet egy bittel meghosszabbítjuk, és ez a bit éppen a sztring bitjeinek 
bináris összege (paritásbit). Ez a kód természetesen hibajavításra nem alkalmas, 
de ha páratlan számú hiba történik az átvitel során, akkor azt a dekódoló észreve- 
szi, és ha van visszacsatolás a csatornán, akkor az üzenet ismételt küldését kérheti. 
A legegyszerűbb eset a következő: Tekintsünk egy bináris szimmetrikus csatornát 
p hibavalószínűséggel. Csakúgy, mint az előző példában, az üzenet a 0 és 1 szim- 
bólumok valamelyike. A kódolási szabály szerint, ha az üzenet 0, akkor a (00) 
kódszót küldjük át a csatornán, míg 1 esetén az (11) kódszót. Dekódoláskor, ha a 
két vett bit megegyezik, akkor annak megfelelően döntünk, ha pedig nem, akkor 
újabb küldést igénylünk. 
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a) Bizonyítsa be, hogy ekkor a dekódolás hibavalószínűsége 


p? 


P PR: B55-5—-— 
e el e,2 1—2p-7-2p2" 


továbbá, hogy egy üzenetbit továbbításához átlagosan 


2 
1—2p--2p? 


bitet kell a csatornán átküldeni. 


22 


b) Hasonlítsa össze ezeket a számokat az előző példa eredményével! (Meg- 
lepő, de bebizonyítható, hogy a visszacsatolás nem növeli a csatornakapa- 
citást, azaz, visszacsatolás nélkül is mindig elérhető ugyanaz a jelsebesség 
és hibavalószínűség, legfeljebb hosszabb blokkokat kell használni.) 


3.2. feladat. 
a) Mennyi az ábrán látható két csatorna kapacitása? 


0 1 0 1 


1 1 1 1 


1/2 1 HERE s ástáé 
2 1/2 2 1 


b) Tegyük fel most, hogy a két csatornát egyszerre használjuk, azaz a beme- 
neti 0,1 vagy 2 szimbólumot mindkét csatornán továbbítjuk. Így egy olyan 
csatornához jutottunk, amelynek három lehetséges bemenete, és négy ki- 
menete van. Mennyi az új csatorna kapacitása? Mutassa meg, hogy mind- 
három csatorna esetén van olyan R — C jelsebességű kód, amely nulla hiba- 
valószínűséggel dekódolható! 


3.3. feladat (mod 11 csatorna). Legyen egy diszkrét memóriamentes csatorna 
bemenete U € (0,1,..., 10]. A csatorna kimenetét, V-t aV — U -3-Z (mod 11) 
egyenlet határozza meg, ahol Z független U-tól és 








P(Z—1)—P(Z—2)—P(Z—3) 5) 


a) Határozza meg a csatorna kapacitását! 
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b) Adjon maximális jelsebességű, egy hosszú blokkokat kódoló csatornakó- 
dot, melyet 0 hibavalószínűséggel lehet dekódolni! Mekkora az így elérhető 
legnagyobb jelsebesség? 


3.4. feladat. Az ábrán látható blokksémán U, Z és W független bináris valószínű- 
ségi változók, 9 pedig modulo 2 összeadást jelöl. Az elrendezés meghatároz egy 
bináris csatornát, melynek bemenete U, kimenete V. 


V 
SSÉS ÉT safe) p- 





Z W 


a) Mennyi a csatorna kapacitása, ha PÍZ—1)—pés PÍW —11— ag? 


b) Ha az első € műveletet kicseréljük bináris , vagy" műveletre, a másodikat 
bináris , és" műveletre, akkor p — Z és g — 2 esetén mi a csatorna kapaci- 
tása? 


3.5. feladat (BSC-k kaszkádja). Kapcsoljunk egymás után k darab bináris szim- 
metrikus csatornát, melyek mindegyikének hibavalószínűsége p. Mutassa meg, 
hogy a kapott csatorna ekvivalens egy bináris szimmetrikus csatornával, amely- 
nek hibavalószínűsége 5 (1 — (1 — 2p)"), azaz a csatorna kapacitása nullához tart, 
ahogy k tart végtelenhez. (Az információelmélet megszületésekor az jelentette 
az egyik legnagyobb meglepetést, hogy ha az egyes csatornák közé kódolókat és 
dekódolókat teszünk, akkor az egyes elemi csatornák kapacitásának megfelelő jel- 
sebesség mellett tetszőlegesen kis hibavalószínűség érhető el. Más szóval, az átvi- 
tel tulajdonságai megjavíthatóak az átvivő közegbe iktatott kódolók és dekódolók 
segítségével, anélkül, hogy a közeg fizikai tulajdonságait megváltoztatnánk.) 


3.6. feladat (Törléses csatorna kapacitása). Bizonyítsa be, hogy a p hibavaló- 
színűségű bináris törléses csatorna kapacitása C — 1 — p. 


3.7. feladat (Gyengén szimmetrikus csatornák kapacitása). A csatornamátrix 
a p(v I u) átmenetvalószínűségeket tartalmazza (u c U,v c V), mégpedig úgy, 
hogy az i-edik sor j-edik oszlopában a p(v; ] uj) valószínűség áll. Egy diszkrét 
memóriamentes csatornát gyengén szimmetrikusnak nevezünk, ha csatornamát- 
rixának minden sora ugyanannak a p valószínűségi vektornak egy permutációja, 
továbbá az oszlopokban álló valószínűségek összege állandó. Mutassa meg, hogy 
egy ilyen csatorna kapacitása 


C — logIVI—H(p). 
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3.8. feladat. 


a) Mennyi az ábrán látható csatorna kapacitása? 


22 


b) Az előző csatornánál legyen p — 2. Tegyük fel, hogy a csatornát összesen 
30-szor használhatjuk. Közelítőleg hány bites bináris üzenetek átvitelét 
valósíthatjuk így meg, ha az üzenet meghibásodásának valószínűségét kis 
szinten akarjuk tartani? 


0 





3 


3.9. feladat (Kapacitás fölötti jelsebesség). Tegyük fel, hogy egyenletes elosz- 
lással véletlenszerűen sorsolt n hosszúságú bináris sztringeket kódolás nélkül to- 
vábbítunk egy p hibavalószínűségű bináris szimmetrikus csatornán. Világos, hogy 
ekkor a jelsebesség nagyobb, mint a csatornakapacitás. Mekkora a dekódolás hi- 
bavalószínűsége? Mekkorára érdemes az n blokkhosszt választani? 


3.10. feladat (MAP és ML dekódolás). Vegyünk egy bináris szimmetrikus csa- 
tornát p hibavalószínűséggel. Tegyük fel, hogy két üzenet egyikét akarjuk to- 
vábbítani, és n hosszúságú ismétléses kódot alkalmazunk, azaz az első üzenet 
esetén az n darab nullából, míg a második esetén az n darab egyesből álló kódszót 
küldjük át a csatornán. Tudjuk, hogy a maximum-likelihood dekódolás azt a kód- 
szót választja ki, amelynek a csatorna kimenetén vett sorozattól mért Hamming- 
távolsága kisebb. Tudjuk, hogy a legkisebb hibavalószínűségű dekódolás a ma- 
ximum a posteriori dekódolás. Tegyük most fel, hogy a két üzenet küldésének 
valószínűsége a, illetve 1 — g. Állapítsa meg a maximum a posteriori dekódolás 
szabályát! Például p — 3 és g — 0.1 esetén határozza meg a dekódolási szabályt n 
több értékére, pl. n — 3, 10, 100 esetén. 


3.11. feladat (ML dekódolás törléses csatornán). Állapítsa meg a maximum- 
likelihood dekódolás szabályát bináris törléses csatornán! 


4. fejezet 
Hibajavító kódolás 


A hibajavító kódok és a titkosítás egészen a " 80-as évek elejéig kívül rekedt a pol- 
gári alkalmazások körén. A kódelmélet esetén ennek elsősorban technológiai okai 
voltak, ezeket az akadályokat a mikroelektronika tömeges elterjedése söpörte el, 
míg a titkosítás azért törhetett be a civil területre, mert megszületett az utóbbi évek 
információtechnikájának egyik legeredetibb ötlete, a nyilvános kulcsú titkosítás. 

A következő két fejezet célja éppen az, hogy ismertesse azon eljárások elmé- 
leti alapjait, melyek már elterjedtek vagy elterjedésük megkezdődött a távközlési 
és informatikai tömegszolgáltatásokban. 

Ez a rész igyekszik összefoglalni a hibajavító kódok elméletéből azokat az 
eredményeket, melyek egyrészt viszonylag egyszerű matematikai alapokkal már 
megérthetők, másrészt a hírközlési illetve informatikai tömegszolgáltatásokban 
alapvető fontosságúak. 

A hibajavító kódok története az információelmélet kialakulásával kezdődött, 
nevezetesen, amikor Shannon bebizonyította a csatornakódolási tételt, vagyis meg- 
találta a zajos csatorna megbízható használatának az elvi korlátját, a csatornaka- 
pacitást, és az alkalmazott bizonyítás nem adott eljárást a csatornakapacitást köze- 
lítő hatékony kódok konstrukciójára. Az "50-es években fedezték fel az alapvető 
blokk-kódokat (Hamming, BCH, Reed-Solomon, stb.) , míg a "60-as évekre tehető 
a konvolúciós kódok és a Viterbi-algoritmus bevezetése. Egészen a " 70-es évek 
második feléig a hibajavító kódolás fő felhasználási területei a katonai hírközlés 
és a nagymegbízhatóságú irányító rendszerek voltak, csak a mikroprocesszorok 
elterjedésével nyílt meg az út a tömeges polgári alkalmazások felé. 
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4.1. ábra. Hírközlési rendszer blokkdiagramja. 


4.1. Kódolási alapfogalmak 


A hibajavító kódolás alapvető módszereit a 4.1. ábrán látható egyszerű hírközlési 
struktúra kapcsán vizsgáljuk. 

Az u és u! vektorok koordinátái egy F halmazból veszik értékeiket, mely hal- 
mazt forrásábécének nevezzük. A kódoló a k hosszú u vektort (az üzenetet) egy 
n hosszú c vektorba (a kódszóba) képezi le. A c koordinátái egy 0 halmazból 
veszik értékeiket. A 0-t kódábécének vagy csatorna bemeneti ábécének fogjuk 
hívni. A csatorna kimenete v, szintén egy n hosszú vektor, melynek koordinátái 
szintén 0-beliek. 

Egy 

€— (C1,...,Cn) 
bemeneti és 

hi (V1,...,Vn) 
kimeneti sorozat esetén azt mondjuk, hogy az m-edik időpontban a csatorna hibá- 
zott, ha cm A Vm. Jelölje d(c, v) azon i pozíciók számát, ahol c; £ vi. 

d(c,v) neve a c,v sorozatok Hamming-távolsága, és azt mondjuk, hogy a 
c sorozat küldésekor és a v sorozat vételekor a hibák száma t — d(c,v). Ezt az 


esetet nevezzük egyszerű hibázásnak, amikor a hiba helye és értéke egyaránt 
ismeretlen. d(c,v) valóban távolság, hiszen 


d(e,v) 20, 
d(e,v) — d(v,e), 
és igaz a háromszög-egyenlőtlenség: 
d(c,v) £ d(c,w) td(w, v). 


Kód (blokk-kód) alatt a 0" halmaz egy C részhalmazát értjük, azaz C minden 
eleme egy n hosszú vektor, melynek koordinátái 0-beliek. C elemeit kódsza- 
vaknak nevezzük. A kódolás egy invertálható függvény, mely k hosszú F-beli 
sorozatot — üzenetet — képez le egy kódszóba, formalizálva: 


FEE", 
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és minden különböző u, u-re f(u), f(u") is különböző. 

Dekódolás alatt két függvény egymásutánját értjük. Az egyik a csatorna ki- 
menetének n hosszú szegmensét képezi le C-be, azaz igyekszik eltalálni a küldött 
kódszót, a másik pedig az f függvény inverze, tehát 


g:9aoc,  f1:coFt 


4 


Mivel f egyértelműen meghatározza f7!-et, ezért dekódolás alatt a későbbi- 
ekben csak a g függvényt értjük. A g dekódoló függvényként az algebrai hibaja- 
vító kódok elméletében speciális függvényt választunk, nevezetesen a v vektorhoz 
megkeressük azt a c" € C kódszót, mely Hamming-távolság szerint hozzá a leg- 
közelebb van, vagy ha több ilyen van, akkor az egyiket, tehát teljesül, hogy ha 
c" — g(v), akkor 


4 eszi . 
d(c,v) — mind(c,v). 


Az előző fejezetben megmutattuk, hogy bináris szimmetrikus csatorna esetén 
ez a dekódolás optimális. Más csatornánál ez a dekódolás már nem feltétlenül 
optimális. 

A dekódolás feladata ezek után arra a messze nem triviális feladatra szűkül, 
hogy egy v vett szóhoz hogyan keressük meg a hozzá legközelebbi c" kódszót 
anélkül, hogy minden d(c, v)-t kiszámítanánk. Ha mégis kiszámítjuk ezeket a 
távolságokat, és minden v-hez megkeressük a hozzá legközelebbi c kódszót, majd 
a neki megfelelő üzenetet, akkor elvben azt eltárolhatjuk, és így egy táblázathoz 
jutunk, melynek címét v adja, tartalma pedig a v-nek megfelelő dekódolt üzenet. 
Ez a táblázatos dekódolásnak a legegyszerűbb, de legpazarlóbb esete, hiszen a 
táblázat g" darab üzenetből áll, ahol g a 0 kódábécé elemszáma. 


4.1. példa. Tekintsük azt a feladatot, amikor a forrás a következő négy lehetséges 
üzenetet bocsátja ki: alma, körte, szilva, cseresznye, melyeket rendre 00, 01, 10, 
11 sorozatokkal forráskódolunk. A 2 hosszú forrásszegmensekhez az f kódoló a 
következő, 5 hosszú kódszavakat rendeli hozzá: 


u1u2 C1C2C3C4C5 

00 6 00000 Ci 
01 6 01101 C2 
10 6 10110 C3 
11 6 11011 C4 
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2 42z 


A g és az fr! függvényt a következő táblázat foglalja össze: 


VIV2V3V4 V5 CI CD C3C4C5 u u) 
00000 

10000 

01000 

00100 

00010 

00001 


a 00000 4 00 


1 
1 
0 
1 a 01101 a 01 
1 
1 


E ADTA KO 
Mm DP um mm e 
Das Da Dem 
PE E E e e 


a 10110 — 10 


mA mm mm mm OO e 
DEBDOOC EOO 
Mm DD mM e 
Mm OS E e e 
FOOCOOO 


A a mm mm OO m— 
A a a DD mm 
0: OS B 
mMmO S. E. 
DP E E m E ée 


a 00000 a 00 


Mm mo 
ezi Se ftzzt S] 
DOOO 
PO nm 
De DD. 


a 01101 KA 01 


Mm E OO 
FO E OO 
A a mi 
oO 5 e 
OP MO 
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Az első 24 kimeneti szó dekódolásakor nincs probléma, hiszen minden 6 szó- 
ból álló csoport minden szava olyan, hogy vagy kódszó (az első helyen álló), 
vagy a kódszó egy bitjének a megváltoztatásával (egy hibával) képződött. A 25— 
28. szavak mindegyike c1-től és c4-től 2, míg c2-től és c3-tól 3 távolságra van. Itt 
önkényesen a dekódolás eredménye ci (jobb érvünk nincs, mint az, hogy jobban 
szeretjük az almát, mint a cseresznyét). A 29-32. szavak mindegyike c1-től és €4- 
től 3, míg c2-től és c3-tól 2 távolságra van. Itt (szintén önkényesen) a dekódolás 
eredménye €2. 


4.2. példa. A 4.1. példában szereplő üzenetekhez rendeljünk 3 hosszú kódszava- 
kat: 


uU1u2 C1C2C3 

00 6 000 Ci 
01 6 011 €2 
10 5 101 €3 


11 6 110 C4 


azaz az u1u2 bitet kiegészítjük egy paritásbittel. Ez a kód már sokkal szegénye- 
sebb, mert ha a v nem kódszó, akkor 3 kódszóból nyerhető 1 bit megváltoztatásá- 
val, azaz 1 hibával. 

A későbbiekben kiderül, hogy a kódoló f függvény leglényegesebb tulajdon- 
sága a C kód egy paramétere, amit kódtávolságnak nevezünk, és dmin-nel jelö- 
lünk: 

dmin — min d(€, c"). 
cze 
c EC 


A 4.1. példában dmin — 3, míg a 4.2. példában dmin — 2. 

A hibajelzés a hibakorlátozó kódolás azon feladata, amikor a vevőben csupán 
detektálni akarjuk a hibázás tényét, azaz azt kérdezzük, hogy van-e hiba. Nyilván 
egy v vett szó esetén akkor tudjuk a hibázást észrevenni, ha v nem kódszó, amire 
garancia, hogy ha c küldött kódszó esetén 


da 2 d(v, c), 
azaz a hibák számára 
dmin 5t, 


tehát egy dmin kódtávolságú kód minden, legfeljebb dmin — 1 számú hibát jelezni 
tud. 

Mivel a 4.1. példában dmin — 3, ezért ez a kód 2 hibát tud jelezni, míg a 4.2. 
példa kódja dmin — 2 miatt 1-et. 
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Hibajavítás esetén azt kérdezzük, hogy ha t a hibák száma, akkor mi bizto- 
sítja, hogy a v vett szóból a c küldött kódszó egyértelműen visszaállítható legyen, 
azaz minden más c" kódszóra 


d(v,c) 5 d(v,c) (4.1) 


legyen. Mivel a Hamming-távolság valóban távolság, ezért teljesíti a háromszög- 
egyenlőtlenséget, azaz 


d(v,c) 2 d(c,e)—d(v,ec), (4.2) 
tehát (4.1) úgy biztosítható, hogy 
d(c,cC)—d(v,e) 5 d(v,c), 
ugyanis, ha ez utóbbi teljesül, akkor (4.1) is teljesül, azaz minden c" -£ €-re 
d(c e) 5.2d(v,c), 
vagyis 


dmin 
2 





5 d(v,e). 


Összefoglalva: egyszerű hibázás esetén fit hiba javítható. 

A 4.1. példa kódja 1 hibát tud javítani, mégpedig a dekódolási tábla első 24 
kimeneti szava esetén, míg a 4.2. példa kódjának hibajavító képessége 0. 

Gyakran fordul elő olyan hibázás, amikor tudjuk, hogy egy pozícióban hiba le- 
het, vagyis tudjuk, hogy más pozíciókban nincs hiba, tehát a hiba helyét ismerjük, 
csak a hiba értékét nem. Az ilyen hibát törléses hibának nevezzük. Egyszerűen 
belátható, hogy minden dnmin — 1 törléses hiba javítható, ugyanis a legrosszabb 
esetben sem fordulhat elő, hogy két c, c" kódszó ugyanazon, de legfeljebb dmin — 1 
pozíciójának törlésével ugyanazt a szót kapnánk. 

A 4.1. példa kódja 2 törléses hibát tud javítani, míg a 4.2. példa kódja 1-et. 

Nyilván adott n kódszóhosszúság és dmin kódtávolság esetén nem lehet akár- 
milyen nagy méretű kódot konstruálni: 


4.1. tétel (Singleton-korlát). Egy M kódszóból álló, n hosszú és dmin kódtávol- 
ságú kódra 
M z gimit 1, 


BIZONYÍTÁS: Legyen k egy természetes szám, melyre 


37 eMM £ 4. 
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Mivel a k — 1 hosszú különböző sorozatok száma g/7! , ezért 97! c M miatt léte- 
zik két kódszó c és c", melyek az első k — 1 koordinátában megegyeznek. Ezekre 


d(c,c) £n—kil, 


következésképpen 
dmin £n—kil, 


azaz 
M L ag L gyedmint Hi 


Jellegzetes esetben M — g", vagyis a kódoló k hosszú forrásszegmensekhez 
rendel n hosszú vektorokat. Azt mondjuk ilyenkor, hogy a kódunk (n,k) paramé- 
terű. Ebben az esetben a Singleton-korlát alakja 


dmin €n—k73-1. 


4.1. definíció. Azon kódot, melyre a Singleton-korlátban — áll, maximális távol- 
ságú vagy MDS (maximum distance separable) kódnak nevezzük. 


A 4.1. példában k — 2, n —5, dmin — 3, tehát ez akód nem MDS kód. 


4.2. tétel (Hamming-korlát). Ha egy (n,k) paraméterű kód t hibát tud javítani, 
akkor 
t /n 
F(a-yegrt (43) 
i—0 NI 


BIZONYÍTÁS: Egy kódszó közepű gömb álljon azokból a vektorokból, melyek 
a kódszóból legfeljebb t hibával keletkeznek. (g— 1)i darab olyan vektor van, 
amely az adott kódszótól valamely fix i pozícióban tér el, ezért egy ilyen gömb 


t B 
E () (g—1)i vektort tartalmaz. A kód akkor tud t hibát javítani, ha a g" darab 
1—0 


[/ 


kódszó körüli gömbök diszjunktak. Ekkor viszont az összes gömbben levő vekto- 
rok száma kisebb vagy egyenlő, mint 9", tehát 


sr) (gel ed 


HI 
Emlékeztetünk arra, hogy egy kód f — fin hibát tud javítani. 
A 4.2. tétel nem mondja azt, hogy ha n, k, t kielégíti a (4.3)-at, akkor létezik 


ilyen paraméterű kód. Azt viszont állítja, hogy ha (4.3) nem teljesül, akkor ilyen 
kód nincs, tehát (4.3) a kód létezésének szükséges feltétele. 
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4.2. definíció. Az olyan kódokat, ahol a Hamming-korlátban — áll, perfekt kódok- 
nak nevezzük. 


Általában a Hamming-korlátot bináris (g — 2) esetben idézik, amikor az a 
következő egyszerű alakú: 
y fs agyk 


1-0 NI 
A következő szakaszban mutatunk egy kódot, a bináris Hamming-kódot (tr — 1), 
mely perfekt kód, azaz 
14n—-277k 


4.2. Bináris lineáris kódok, bináris Hamming-kód 


Ebben a szakaszban kódok egy fontos csoportjával ismerkedünk meg. A további- 
akban a kódjainkban szereplő kódszavakat alkotó szimbólumok legyenek 0 vagy 1 
értékűek, az összeadás és a szorzás pedig a bináris összeadás és a bináris szorzás, 
azaz a modulo 2 összeadás és a modulo 2 szorzás. 

Vezessük be a lineáris kód fogalmát: 


4.3. definíció. Egy C kód lineáris, ha a C halmaza lineáris tér, azaz ha minden 
c, €C-ree-e e C. 


A lineáris kód definíciójából következik, hogy a 0 vektor eleme minden line- 
áris kódnak, vagyis minden lineáris kód esetén a 0 kódszó. Egyszerűen belátható, 
hogy a 4.1. és 4.2. példa kódja lineáris. 

A lineáris kódok jelentőségét az adja, hogy az egyes üzenetekhez tartozó kód- 
szavak viszonylag egyszerűen generálhatók, és ugyancsak egyszerű módszer ta- 
lálható a vett kódszavak hibamentességének vizsgálatára, vagyis a hibadetektá- 
lásra, és a hibák javítása sem bonyolult. A következőkben e módszereket fogjuk 
bemutatni. 

Jelentsen C továbbra is egy lineáris kódot, a kódszóhossz legyen n. Ekkor C az 
n hosszúságú bináris koordinátájú vektorok terének egy altere; , kódszó" helyett 
gyakran , vektor"7-t fogunk mondani. 

A valós vektortérben megszokott lineáris függetlenség és bázis fogalmak itt is 
teljesen hasonlóan értelmezhetők, vagyis 


4.4. definíció. A gi, g2, . . . , gj c C vektorok lineárisan függetlenek, ha a; c f0,1 
mellett 


J 
Dog — 0 
i—I 


csak úgy állhat elő, ha a; — 0 minden i — 1,2, . . . , j-re. 
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4.5. definíció. A g1,g2, . . .  gx c C vektorok a C lineáris tér egy bázisát alkotják, 


24 


ha lineárisan függetlenek, továbbá igaz az, hogy minden c € C vektor előállítható 
k 
c— ug; (4.4) 
i—1 


alakban, ahol u; c 10,1) minden i — 1,2, . . . ,k-ra. 


Az utóbbi definícióban a bázist alkotó vektorok lineáris függetlenségéből kö- 


24 


vetkezik, hogy a kódszavak fenti típusú előállítása egyértelmű is, ha ugyanis lé- 


24 


tezne két különböző előállítás valamely c € C-re, tehát 


k 
CG ) ui 8i 
i—1 


k 
c Dig; 
i—1 


ahol nem áll fönn u; — y; minden i-re, akkor a két egyenletet kivonva egymásból 
a nullvektornak egy nem triviális előállítását kapnánk a bázisvektorokkal, ami 
ellentmondana azok lineáris függetlenségének. 


A (4.4) egyenlőség fölírható mátrixalakban: 
c—uG, (4.5) 


ahol u — (ui, u, .. . ur), G pedig a bázisvektorokból mint sorvektorokból álló 
mátrix. A (4.5) egyenlettel tehát egy k-dimenziós és egy n-dimenziós vektort ren- 
delünk össze lineáris transzformációval, mégpedig kölcsönösen egyértelmű mó- 
don. Azt fogjuk mondani, hogy az u üzenethez a c kódszó tartozik. 

A k-dimenziós u vektorokkal 2"-féle üzenetet fejezhetünk ki, s ezeket kódol- 
juk a C kóddal. C elemei azonban n-dimenziós vektorok, és n nem kisebb k-nál, 
hiszen k az n-dimenziós vektorok C alterének dimenziószáma. A k — n esetnek 
nincs most jelentősége, ha k kisebb, mint n, akkor viszont világos, hogy nem min- 
den vektort kell felhasználni kódszónak, vagyis kódunk redundáns lesz, s ezt a 
redundanciát tudjuk hibajavításra felhasználni. 

Az üzenetekhez a kódszavakat a G mátrix segítségével rendeljük hozzá, vagyis 
a G mátrix jelöli ki az n-dimenziós vektortérnek a kódot jelentő C alterét, a kódot 
G , generálja" . 


4.6. definíció. A fenti tulajdonságú G mátrixot a C kód generátormátrixának 
nevezzük. 
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Vegyük észre, hogy ha nem törődünk azzal, hogy melyik kódszó melyik üze- 
nethez tartozik, csak a kódszavak halmazát tekintjük, akkor G nem egyértelmű, 
vagyis több mátrix is generálhatja ugyanazt a C kódszóhalmazt. A következő 
definíció egy megfeleltetést definiál az üzenetek és a kódszavak között. 


4.7. definíció. Egy (n,k) paraméterű lineáris kód szisztematikus, ha minden kód- 
szavára igaz, hogy annak utolsó n — k szimbólumát elhagyva éppen a neki megfe- 
lelő k hosszúságú üzenetet kapjuk, más szavakkal a k hosszú üzenetet egészítjük 
kin— k karakterrel. 


A 4.1. szakaszban már leszögeztük, hogy dekódolás alatt csak az esetleges 
hibák kijavítását értjük, aminek eredményeképp egy kódszót kapunk. Az üzenet- 
vektor visszanyeréséhez még el kell ugyan végezni a kódolás inverz műveletét, ez 
azonban rendszerint triviális lépés, szisztematikus kód esetén például csak el kell 
hagyni a kódszó egy részét (a végét). 

Szisztematikus kód esetén a generátormátrix is egyértelmű, mégpedig 


G — (Ik, B) (4.6) 


alakú, ahol I, a k x k méretű egységmátrix, B pedig k x (n—k) méretű mátrix. Az 
u üzenethez tartozó c kódszó szerkezete tehát: 


c — (11, U2 , . . . , Uk, Ck-4-1, Ck-429  )Cn)- 


A c első k koordinátájából álló szegmensét üzenetszegmensnek, az utolsó 
n — k koordinátájából állót paritásszegmensnek nevezzük. 

A lineáris kódok további tulajdonságai elvezetnek az ígért egyszerű hibade- 
tektáláshoz illetve hibajavításhoz. 


4.8. definíció. Ha egy n — k sorból és n oszlopból álló H mátrixra 
Hc" —0 


akkor és csak akkor, ha c € C, akkor H-t a C kód paritásellenőrző mátrixának 
nevezzük. (Röviden paritásmátrixot fogunk mondani.) 


H segítségével tehát meg tudjuk állapítani, hogy egy vett szó valóban kódszó-e. 


4.3. tétel. Ha G és H ugyanazon C lineáris kód generátormátrixa illetve paritás- 


mátrixa, akkor 
HG" — 0. 


Minden lineáris kódnak van paritásmátrixa. 
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BIZONYÍTÁS: Jelölje 0" a k hosszú bináris sorozatok halmazát. Ekkor minden 
u c 0".hoz létezik c c C, amire c — uG. Ugyanakkor ec € C miatt HcT — 0, azaz 


Hc" — H(uG)" — HG" u" — 0. 


Az utolsó egyenlőség pedig csak úgy állhat fönn minden u c OF-ra, ha HGT — 
0, amint állítottuk. (Megjegyezzük, hogy amennyiben H kielégíti a HG7 — 0 
egyenletet, akkor H még nem biztos, hogy paritásmátrix.) A tétel második felét 
először szisztematikus esetben látjuk be. Legyen 


G — (Ik, B) 


alakú, keressük H-t 
H — (AI, ,) 


alakban. A tétel első fele miatt 
HG" — (AI, x)(Ik,B)" —A 3 BT —0. 


Azaz 
A — —BT 


kell teljesüljön. (Bináris esetben —B? — BT.) Meg kell mutatni, hogy az így 
kapott H mátrix valóban paritásmátrix. Azt tudjuk, hogy minden c kódszóra 
HcT — 0. A másik irány hiányzik: ha egy € — (c1,C2,.. . , Ck,Ck4.1; : : . , Cn) Vek- 
torra HcT — 0, akkor c kódszó, de ez is egyszerű: 


0—Hc" — (AI, pe" — (—B" I, pe" 


miatt 
—(C1,C2, . . . , Ck)B  (Ckx1, : . . ,Cn) — 0, 
tehát 
(Ck315 5 Cn) — (C1, C2, . . . CK) B, 
következésképp 
(C1,C2,  . . , Ck, Ckar1p : 5 Cn) — (C1, C2, . . . , Ck) (Ik, B), 


ezért c tényleg kódszó. 

Beláthatjuk, hogy egy tetszőleges (nem feltétlenül szisztematikus) kódnak van 
paritásmátrixa, hiszen ezt még csak szisztematikus esetben tudjuk. Az igazolás fő 
gondolata arra épül, hogy minden lineáris kód általános értelemben szisztema- 
tikus. Egy lineáris kódot általános értelemben szisztematikusnak nevezünk, ha 
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létezik egy G generátormátrixa és ii , i2 , . . . ix egész számok úgy, hogy G ij-edik 
oszlopa a j-edik helyen Il, a többi helyen 0. Nyilván egy ilyen tulajdonságú G 
mátrix oszlopcseréinek egy sorozatával szisztematikus mátrixot kapunk, ahol már 
elő tudjuk állítani a paritásmátrixot, és az előző oszlopcserék inverzével az eredeti 
kód egy paritásmátrixát kapjuk. Általános értelemben szisztematikus generátor- 
mátrixhoz úgy juthatunk, ha bizonyos sorok nem 0-szorosát hozzáadjuk egy másik 
sorhoz, úgy, ahogy azt a Gauss-eliminációnál megszoktuk. Ezek a transzformá- 
ciók azért jogosak, mert a G mátrix sorai egy bázist alkotnak, és a transzformáció 
után is egy bázist alkotnak, mivel a kód lineáris. B 


4.3. példa. Adjuk meg a 4.1. példa kódjának szisztematikus generátormátrixát, 
ha van, és a paritásmátrixot! Ezt úgy kapjuk meg, ha G első sora cz, míg a második 
c2, mivel ekkor az első 2 x 2-es részmátrix egységmátrix: 


hd zteat 0 
6-( 01 JÖLYEB 


A fentiek alapján a paritásmátrix: 


11100 
H—- I 10010 
01001 


Ugyanígy kapjuk a 4.2. példa szisztematikus generátormátrixát és paritásmátrixát: 


4-0 ú 
öl a 81 


H—(1 1 1). 


A következőkben a súly fogalmát definiáljuk, megmutatjuk, hogy lineáris kó- 
doknál a minimális súly a kódtávolsággal egyenlő, majd további három tételt mon- 
dunk ki velük kapcsolatban. (Emlékeztetünk, hogy két kódszó távolsága azon 
koordinátáik száma, ahol a két kódszó különbözik.) 


4.9. definíció. Egy c vektor súlya a koordinátái között levő nem nulla elemek 
száma, jelölése w(c). 


4.10. definíció. Egy C kód minimális súlyán a 


wmin — minw(c) 
ceC 
c-0 


számot értjük. 
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4.4. tétel. Ha C lineáris kód, akkor a kódtávolsága megegyezik a minimális sú- 
Iyával, azaz 


dmin — Wmin- 
BIZONYÍTÁS: 


dmin — mind(e, c") — minw(c— c") — minw(ec") — Wmin, 
cAc cz c"A0 
ahol az utolsó előtti egyenlőség felírásakor a C kód linearitását használtuk ki, eb- 
ből következik ugyanis, hogy c" — € — c" is kódszó, továbbá, az is, hogy minden 


kódszó előáll ilyen különbség alakjában. (Utóbbi ahhoz szükséges, hogy a mini- 
mum képzésekor valóban minden c" € C-t figyelembe vehessünk.) HI 


A 4.4. tétel jelentősége abban áll, hogy segítségével a dmin definíció alap- 
ján történő kiszámításához szükséges ELS] műveletet a wmin kiszámításához 
szükséges IC] — 1 műveletre redukálhatjuk. (]JC]I-vel a C elemszámát jelöltük.) 

A következőkben azt mutatjuk meg, hogyan használható a H mátrix a dekó- 


dolás során. 
4.11. definíció. Az s — eH! mennyiséget szindrómának nevezzük. 


Legyen az adott kódszó c, a vett szó v. Az e — v — € vektort hibavektornak 
nevezzük. Vegyük észre, hogy 


Hv" — H(c--e)" — Hc" 3 He" — He! , 


vagyis Hv! értéke csak a hibavektortól függ, az adott kódszótól nem. A szindróma 
tehát a hibavektor egy lineáris leképezése. 

A dekódolás leggyakoribb módja a szindróma dekódolás. A fentiek alapján 
a dekódolás a következőképpen mehet végbe: a vett v szóból kiszámítjuk az s7 — 
Hv! — He! szindrómát, ennek alapján megbecsüljük a hibavektort, s ezt v-ből 
levonva megkapjuk a kódszóra vonatkozó becslésünket. 

A szindrómának hibamintára történő leképezési módját táblázatba szokás fog- 
lalni, az ún. standard elrendezési táblázatba. 

Valamely e hibaminta által generált mellékosztály az e-- ce, c c C(n,k) vek- 
torok halmaza. Adott mellékosztály elemeihez azonos szindróma tartozik. Az 
e — 0 zérus hibavektorhoz tartozó mellékosztály a C(n,k) kóddal azonos. Ha egy 
e hibaminta e — e! -- c alakban írható fel, akkor a két hibaminta (e és e") azo- 
nos mellékosztályt generál. Azonos mellékosztályba tartozó hibaminták közül 
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válasszuk ki a legkisebb súlyút, s azt mellékosztály-vezetőnek nevezzük. Ennek 
megfelelően a standard elrendezési táblázat az alábbi struktúrájú: 


szindróma  mellékosztály- 














vezető 
50) e0 —0 ai) el) 
s) el) aze aza 
s(a71) elz7"—1) c) ele) e(g—1) ele) 























em e 


mellékosztály elemek 


A w(eit) 5 w(e0), el0 —0, 1—0, 1, . . . , 977" — 2 a szokásos sorrend. Köny- 
nyen látható, hogy a táblázat elemei különbözőek. Egy soron belül ez nyilvánvaló. 
Különböző sorokat tekintve tegyük fel, hogy ef) 3- e) — e 4 el", aholi 5 k. 
Mivel ebből e() — el 4 elm - el/) — el 3. el) következik, ahol c) elm elm e 
C(n,k), ezért ef-nek is az el mellékosztály-vezetőjű sorban kell lennie, ami 
ellentétes kiindulási feltételünkkel. 

Az e, 1 —1,2,. . . , 977!" — 1 mellékosztály-vezetőket javítható hibaminták- 
nak nevezzük, ugyanis ha a v vett szó szindrómája sÜ, akkor a €— v — el) kód- 
szóra döntünk. A szindróma dekódolásnak ezt az — elsősorban elvi — módját 
táblázatos dekódolásnak nevezzük (look up table decoding). 


A szindrómát használó táblázatos dekódoló tárja a vizsgált bináris esetben 
27-k darab hibavektort tartalmaz, és a táblázat elemeit a szindróma segítségével 
címezzük. 


4.4. példa. Adjuk meg a javítható hibamintákat a 


00111 
H— [OO 1010 
100 11 


mátrixszal adott kód esetére. 
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A dekódolási táblázat a következő: 


javítható 
szindróma hibaminták 

000 00000 
001 10000 
010 01000 
011 00110 
100 00100 
101 00001 
110 01100 
111 00010 


Tehát a standard elrendezés fenti táblázata alapján történő szindróma dekódolással 
az egyszeres hibák és a 00110, 01100 két hibát tartalmazó hibaminták javíthatók. 


Illusztrációként egy klasszikusnak számító kódot mutatunk be, mely bináris 
Hamming-kód néven ismeretes. 

Olyan kódot keresünk, mely egy hibát tud javítani, vagyis ha c-t adjuk, és v-t 
vesszük, akkor 1 2 d(ce, v) esetén biztosan meg tudjuk mondani v ismeretében c-t. 
Legyen a kódunk lineáris és bináris. 

A hibajavítás céljára r bitet kívánunk felhasználni, vagyis az n kódszóhossz és 
a k üzenethossz különbségét r-nek rögzítjük. Ezen adott r és 1 hibát javító képes- 
ség mellett szeretnénk a lehető legnagyobb £-t elérni, hogy minél több üzenetünk 
lehessen. Legyen a majdani kód paritásmátrixa: 

H — (af ,a3 ,...,al). 


kés öntet ; 


Legfeljebb egy hiba esetén az e hibavektor vagy 0, vagy egységvektor, tehát 
pontosan 1 koordinátája 1-es. Ekkor az s — eH? szindróma vagy 0, vagy valame- 
lyik a;-vel egyenlő. Akkor és csak akkor tudjuk tehát e-t (és így €c-t is) egyértel- 
műen megállapítani, ha az a;-k mind különbözők, és egyik sem 0. Mivel H sorai- 
nak a száma n — k — r, az a;-k legfeljebb 27 — 1 félék lehetnek, ha egyikük sem 0. 
Mivel minél nagyobb £-ra, és így a rögzített r révén minél nagyobb k -- r — n-re 
törekszünk, mind a 2" — 1 lehetőséget használni fogjuk. Ezzel lényegében megad- 
tuk H-t, hiszen megmondtuk, hogy H az összes lehetséges r hosszúságú nemnulla 
oszlopvektorból álló mátrix. Ez pedig már definiálja a kódszóhalmazt a 


Hc" —0 


egyenletrendszer összes megoldásvektorának halmazaként. (H oszlopvektorainak 
sorrendjén csak az fog múlni, hogy melyik üzenethez melyik kódszót rendeljük, 
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tehát például, hogy szisztematikus lesz-e a kód. V.ö. a 4.7. definíció után mon- 
dottakkal.) Az így kapott kódot nevezzük bináris Hamming-kódnak, mely tehát k 
hosszú üzenethez n hosszú kódszót rendel, ahol n és k között fennáll az 


n7-277-k. 1 (4.7) 


összefüggés. Ilyen tulajdonságú számpárok a következők: 


7 
15 11 
31 26 
63 57 
127 120 


A (4.D-ből és a 4.2. tételből következik, hogy az (n,k) paraméterű bináris 
Hamming-kód perfekt kód, tehát 


4.5. tétel. Nincs olyan egy hibát javító bináris kód, amely egy Hamming-kóddal 
azonos szóhosszúságú, és a hozzá tartozó kódszavak száma nagyobb, mint a meg- 
felelő Hamming-kód kódszavainak száma. 


4.5. példa. A (7,4) paraméterű Hamming-kód paritásmátrixa 
1 101100 
H-I 1011010 
0O0111001 


A generátormátrixa ebből könnyen kiszámítható a már szerepelt A — —BT 


összefüggés alapján: 


2sáa E 
az ztési ss 
A mm oO —m— 


0 
1 
1 
1 


a DO 0 
DD Hi 
mm OO mm 


A (7,4)-es Hamming-kódot egy páratlan paritásúra kiegészítő paritásbittel ka- 
punk egy (8, 4) paraméterű, továbbra is egy hibát javító kódot, amelyet a Teletext- 
ben használnak [17]. 

A közvetlen műholdas műsorszórás (Direct Broadcasting Satellite, DBS) digi- 
talizált hangját is hibajavító kóddal védik. Így aD2-MAC/PACKET szabványa [3] 
szerint az egyik változatban a 14 bites hangminta felső 11 bitjét egy (16,11) pa- 
raméterű kóddal kódolják, ami a (15, 11) paraméterű Hamming-kód kiegészítése 
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egy páratlan paritásbittel. A másik változatban a 10 bites hangminta felső 6 bitjét 
kódolják egy (11,6)-os kóddal. Megjegyezzük még, hogy a csomagolt, kódolt 
beszédmintákat egy olyan csomagfejjel látják el, melyet 2 hibát javító (71,57) 
ill. (94,80) paraméterű BCH-kóddal védenek, míg a legfontosabb adatokat, az 
úgynevezett szolgáltatásazonosítást egy három hibát javító (23, 12) paraméterű 
Golay-kóddal kódolják. A BCH-kódokat a 4.9. szakaszban definiáljuk részlete- 
sebb tulajdonságaik nélkül, míg a Golay-kódok tárgyalása újabb algebrai appará- 
tus bevezetését igényelné. 


4.3. Véges test 


Hatékony hibajavító kódok konstrukciójához szükséges, hogy a nembináris 0 — 
G kódábécé struktúrált legyen, mely például úgy lehetséges, hogy műveleteket 
vezetünk be G-n. 


4.12. definíció. Egy G halmazt testnek nevezünk, ha értelmezve van tetszőleges 
két eleme között két művelet, amelyeket összeadásnak illetve szorzásnak neve- 
zünk, -- illetve x szimbólumokkal jelöljük, és G rendelkezik a következő tulaj- 
donságokkal: 


1. G az összeadásra nézve kommutatív csoport, azaz 


a) Minden a, B € G esetén a-t B e G, tehát G az összeadásra nézve zárt. 
b) Minden a, B,y € G esetén a -- (B 1-y) — (a -- B) 4-y (asszociativitás). 


c) Létezik egy 0-val jelölt eleme G-nek úgy, hogy minden a € G-re 0 -7- 
a — a 3-0 — a. 0-t nullelemnek nevezzük. 


d) Minden a e G-hez létezik B c G úgy, hogy a--B — 0. B-t az a. additív 
inverzének nevezzük és —a-val jelöljük. 


e) Minden a, B € G-re a --B— B-- a (kommutativitás). 
2. G V(0) a szorzásra nézve kommutatív csoport, azaz 


a) Minden a, B € GY(0) esetén a -B c GY(0) (zártság). 

b) Minden a B.,yE GMO) esetén (a. - B) :y— a - (B - y) (asszociativitás). 

c) Létezik egy 1-gyel jelölt eleme GY(0)-nak úgy, hogy 1-a— a-1— 
1-et egységelemnek nevezzük. 

d) Minden a € GY(0) esetén létezikB e GY(0) úgy, hogy a -B— B- a — 
1. B-t az a, multiplikatív inverzének nevezzük, és 07! -gyel jelöljük. 

e) Minden a, B c GY(0)-ra a - B — B - a (kommutativitás). 
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3. Minden a, B,yE G-rea-0—0-a — 0 és a: (B--y) — (a -B) 3 (a: y) (diszt- 
ributivitás). 


Egyszerű konvenciókkal egy G testben definiálható a kivonás és az osztás a 
következő módon: a — B alatt az c-nak és a B additív inverzének összegét értjük, 
azaz a (—B)-t. a/P alatt az o-nak és a B multiplikatív inverzének a szorzatát 
értjük, azaz o. : B-!-et, amennyiben B nem 0. 


Példák testre: 

1. Valós számok halmaza a valós összeadással és szorzással. 

2. Racionális számok halmaza a valós összeadással és szorzással. 

3. Komplex számok halmaza a komplex összeadással és szorzással. 
4. (0,1) a bináris összeadással és szorzással. 

Egy g elemszámú G testet véges testnek nevezünk és GF(g)-val jelöljük. 


Sajnos egy GE(g) esetén g nem lehet bármilyen. Ez azért fontos, mert a kód- 


4 Pot 4 


ábécé a későbbiekben GH(g) lesz. Bizonyítás nélkül közöljük a következő tételt: 


4.6. tétel. Egy GF(g) esetén g — p" alakú, ahol p prímszám, tehát g vagy prím- 
szám, vagy prímhatvány. 


Lényeges különbség van a prím és a prímhatvány méretű véges testek arit- 
metikája között. Most a prímszám méretű véges testek aritmetikáját tárgyaljuk, a 
másikat csak a polinomok ismeretében tudjuk egyszerűen bevezetni. 


4.7. tétel. A G — (0, 1, . . . p— 1) halmaz a modulo p aritmetikával egy p prím- 
szám esetén véges test, azaz a testműveletek 


a3b-a7b mod p, 
a:b—a-:b modp, 
ahol -- illetve : jelöli a valós összeadást illetve szorzást. 


BIZONYÍTÁS: Ellenőrizzük az 1., 2., 3. pontokat a test definíciójában! 1. a)—e)-ig 
ez egyszerű, csupán azt jegyezzük meg, hogy 


—a—-—p-—a mod p, 


ahol — a valós kivonást is jelöli. 2. a), b), d) és 3. megint triviális. 2. a)-nál azt kell 
megmutatni, hogy a,b - 0 esetén a - b - 0. Ellenkező esetben a -b — Np alakú 
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lenne, tehát p osztaná a : D-t, azaz vagy a-t vagy b-t, ami nem lehet, mert mindkettő 
1 és p— 1 közötti szám. 2. d)-hez azt kell belátni, hogy minden a -- 0-hoz létezik 
b, hogy a:b—1. Az 1-a,2-a,3-a,...,(p— 1) :a számok mind különbözők, 
mivel ellenkező esetben j-a — i - a lenne, azaz (j —i) :a — 0 lenne, ami 2. a)- 
nak ellentmond. A fent említett p— 1 darab szám halmaza tehát megegyezik a 
(1, 2, . . . p— 1) halmazzal, ezért létezik b, melyre b-a— 1. Hi 


Lássuk most a GH(g) néhány egyszerű tulajdonságát! 
4.1. lemma. Minden 0 - a e GF(g)-ra 
a17! — 1. 


BIZONYÍTÁS: Legyenek a , a2 , . . . 1-1 a GF(g) nem 0 elemei, ekkor a - 0 
esetén 


a:d1i,a:a2,...,a"dag-1 


15 mind különbözők és nem 0-k, tehát 


(a1, a2, ... 49-11 — fa: d1, a: a2,...,a:ag-i1 b, 
következésképp 
d1":da2"...:dg-1 — a.a "d2"..."dg-1, 
ahonnan az állítás a bal oldal inverzével való szorzással következik. HI 


4.2. lemma. Minden 0 - a e GFH(g)-ra létezik egy legkisebb m természetes szám, 
amit az a elem rendjének nevezünk, melyre 


és az a, a? , . . . ,a" elemek mind különbözők. m osztója g — 1-nek. 


BIZONYÍTÁS: — Tekintsük az a!,a?,a?,... sorozatot! Mivel a sorozat minden 
eleme GF(g)-beli, ezért GF(g) végessége miatt létezik olyan i — j, melyre 
a! — aj , 


azaz 
a Tsi, 
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tehát létezik olyan m!" természetes szám, melyre ar —1. Legyen m ezek közül a 
legkisebb. Ha az m! természetes szám olyan, hogy 


1 
a" -1 


és m —k-m--lI alakú, aholm 5 I 5 0, akkor 
TA ama me) (a) l l 


1—-—a "da — da, 


tehát / csak 0 lehet, ezért m" az m többszöröse, következésképp a 4.1. lemma miatt 
g—1 is m többszöröse. Be kell még látni, hogy a, a?, . . . ,a" különbözők. Ennek 
bizonyításához tegyük fel, hogy létezikm23i 5 j2 Il, hogy 

a — a, 
tehát 

aj — 1, 


ami nem lehet, mert m - i— j. Hi 


4.13. definíció. Egy a ec GF(ag)-t a GF(g) primitív elemének nevezünk, ha a 
rendje g—l1. 

A 4.5. szakaszban bizonyítjuk, hogy 
4.8. tétel. Minden GH(g)-ban létezik primitív elem. 


4.6. példa. GF(7). 


elem (- 0) hatványai rendje 

1 1 1 

2 2,4,1 3 

3 3,2,6,4,5,1 6 (primitív elem) 
4 4,2,1 3 

5 5,4,6,2,3,1 6 (primitív elem) 
6 6,1 2 


A prímitív elem egyrészt igen fontos hatékony kódok konstrukciójakor, más- 
részt GF(g)-beli szorzások és osztások elvégzésekor. Ha a a GF(g) egy primitív 
eleme, akkor bevezethetjük egy a c GF(g) testelem c alapú logaritmusát az 


loga 


08 -a 


egyenlet (egyértelmű) megoldásával, ahol a 5 0. Ha a,b a GF(g) nem 0 elemei, 


akkor 


a.b — ologa § alogb s. ologa-og b 


tehát egy a alapú logaritmustábla és egy inverzlogaritmus-tábla segítségével a 
szorzás (illetve az osztás) visszavezethető valós összeadásra (illetve kivonásra). 
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4.4. Lineáris kódok, nembináris Hamming-kód 


Ebben a szakaszban kódok egy fontos csoportjával ismerkedünk meg, melyek 
a 4.2. szakaszban megismert bináris lineáris kódok kiterjesztései nembináris esetre. 

A továbbiakban a kódjainkban szereplő kódszavakat alkotó szimbólumokat 
vegyük GF(g)-ból, a lehetséges szimbólumok tehát a 0, I , 2, . . . , g— 1 számoknak 
feleltethetők meg. 


4.14. definíció. Egy C kód lineáris, ha a C halmaz lineáris tér GF(g) fölött, azaz 
ha minden c, c! e C-re 
ctcEC 


illetve B c GF(g) esetén 
Pece C. 


A 4.2. szakaszhoz hasonló módon belátható, hogy tetszőleges C lineáris kód- 
hoz létezik egy k lineárisan független sorból és n oszlopból álló G mátrix, melyre 


c—uG, (4.8) 


ahol a k hosszú u üzenethez a c kódszó tartozik, és a G mátrixot a C kód generá- 
tormátrixának nevezzük. 

A bináris esethez hasonlóan a C lineáris kódhoz egy n — k sorból és n oszlop- 
ból álló H mátrixot paritásmátrixnak nevezünk, amennyiben 


Hc" —0 


akkor és csak akkor teljesül, ha c € C. 
A bináris eset másolataként kaphatjuk, hogy 


4.9. tétel. Minden C lineáris kódnak van paritásellenőrző mátrixa. 


Példaként bemutatjuk a nembináris Hamming-kódot. Ismét 1 hibát javító 
kódot akarunk konstruálni. A bináris esetben a hiba javításához elég volt ismerni 
a hiba helyét, amihez elégséges volt, ha a H paritásmátrix minden oszlopa külön- 
böző. Nembináris esetben nemcsak a hiba helyét, hanem a hiba értékét is meg 
kell állapítani, ezért a H mátrix oszlopait úgy választjuk, hogy azok nem 0-k, 
mind különbözők legyenek, és az első nem 0 elem minden oszlopban 1 értékű 
legyen. Ekkor, ha egy hiba esetén az az i-edik helyen fordul elő és értéke e;, akkor 
a szindróma s — e;a;, ahol af a H i-edik oszlopa. Tehát a hiba értéke, e; éppen a 
szindróma első nem 0 értéke, míg a; — 2 amiből az i visszakereshető. 
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Ha H tartalmazza az összes lehetséges, a fenti módon megengedett oszlop- 
vektort, akkor 





gr és 
szek] g Es 1 , 
azaz 
14-n(g—1)— gt, 
másrészt a Hamming-korlát miatt 
17-n(g—1) Sg7t 


tehát 
4.10. tétel. A maximális hosszúságú nembináris Hamming-kód perfekt kód. 


A nembináris Hamming-kódok közül különösen érdekes az az eset, amikor 
a kód szisztematikus és a paritásszegmens hossza 2, azaz n—k — 2. Legyen a 
a GH(g) egy nem 0 eleme, melynek rendje m 2 2. Válasszunk n £ (m7-2)-t és 
k — (n—2)-t. Ekkor a paritásmátrix: 


1 1 1 --.-. 1 1 0 
H-( a az .-.. ar 0 1 


Ez egy (n,n —2) paraméterű nembináris Hamming-kód paritásmátrixa. 
A 4.3. tétel alkalmazásával nyerjük a kód generátormátrixát: 


10 0 0 -.. 0 —1 —I1 
0 10 0 --. 0 —1 —a 
G—Í 00 1 0 --- 0 —1 —0£ 
0900 0 -.. 1 —1 —a 


Mivel ez a kód 1 hibát tud javítani, ezért dmin 2 3, de a Singleton-korlát miatt 
dmin Cn-—k--1 — 3, ezért 


4.11. tétel. Az (n,n — 2) paraméterű nembináris Hamming-kód MDS kód. 


4.7. példa. Írjuk fel a GF(7) feletti, (8,6) paraméterű Hamming-kód generátor- 
mátrixát és paritásmátrixát! GF(7)-ben a 3 primitív elem (lásd a 4.6. példát), tehát 


H-( 1 111I1I1I1I0 
"113264501 
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1000 00 0 —-1 -I 100000 66 
091000 0 —-1 —3 010000 6 4 
G - 001000 -7- [ff JO0OI0O00065 
09000 10 0 -1 -6 00010061 
0000 1 00 —-1 —4 00001063 
00000 1 —-1 —5 000001 62 


4.5. Véges test feletti polinomok 


GFE(g) feletti vektorok reprezentálására, és vektorok közötti szorzás kényelmes 
bevezetésére egy célszerű eszköz a polinomreprezentáció: 


4.15. definíció. a(x) — ao 4 a1x- ...1-amx" GF(g) feletti m-edfokú polinom, 
ha 
a; E GF(g), i—0,....m, am 0, 


x c GF(g). 
A polinom m fokszámát deg a(x) jelöli. (Az a(x) — 0 polinom fokszáma definíció 
szerint legyen —oo.) 
4.16. definíció. a(x) — b(x), ha a; — b; minden i-re. 
Műveletek polinomok között: 


1. Polinomok összeadása: c(x) — a(x) 1- b(x) tagonként történik GF(g) feletti 
műveletekkel: c; — a; -- b;. Nyilvánvalóan 


degc(x) A max fdega(x), degb(x) ). 


2. Polinomok szorzása: c(x) — a(x)b(x) minden tagot minden taggal szor- 
zunk, majd az azonos fokú tagokat csoportosítjuk (az összeadások és szor- 
zások GKH(g) felettiek): 


min(i,dega(x)) 
Ci — )3 dj: bi. j. 
j—0 
Nyilván 
degc(x) — dega(x) 1-degb(x) 
4.8. példa. Ha GFO) felett a(x) — 1-3-x és b(x) —14-x--xő, akkor a(x) 1-b(x) — 
2 és a(x)b(x) — 142 2 al 
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4.12. tétel (Euklidészi osztás polinomokra). Adotta(x) és d(x) — 0 esetén egyér- 
telműen létezik olyan g(x), r(x) úgy, hogy 


a(x) — g(x)d(x) tr(x), 
és degr(x) a degd(x). 


4.17. definíció. r(x)-et az a(x)-nek d(x)-re vonatkozó maradékának nevezzük. 
Jelölés: r(x) — a(x) mod d(x). 


4.18. definíció. d(x) osztja a(x)-et, ha a(x) mod d(x) — 0. Ezt a továbbiakban 
d(x) I] a(x) formában fogjuk jelölni. 


A 4.12. TÉTEL BIZONYÍTÁSA: Az egész számok euklidészi osztási algoritmusá- 
nak analógiájára megadunk egy rekurzív algoritmust. Legyen a(x) m-edfokú és 
xM együtthatója an, d(x) k-adfokú és x/ együtthatója dr. Ha m 2 k, akkor legyen 


ri(x) — a(x) — amde txt d(x) 


és 
gi(x) — üget 
akkor 
a(x) — gi(x)d(x) 7-ri(x) 
és 


deg(r1(x)) c deg(a(x)). 
Ha most a(x)-nek van egy 
a(x) — ailx)d(x) -rilx) 
előállítása, ahol deg(ri(x)) C deg(d(x)), akkor az előző módon r;(x) előáll 
ri(x) — giz 169d(x) —- ris 1(x) 
alakban, ahol deg(r;1(x)) c deg(rj(x)), tehát 
a(x) — (gi (0) -k az) dt) tri (30), 


és deg(ri(x)) monoton fogy, ezért legfeljebb m — k lépésben a tétel által megkí- 
vánt felbontást kapjuk. Az egyértelműség igazolásához tegyük fel, hogy van két 
különböző felbontás: 


a(x) — ge)d(x) rr(x) 
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ax) —g t)dt) kr), 
és g(x) A g (x), tehát 


Mivel g(x) A g (x), ezért 


deg(r(xy—r(x)) — deg((g()—at))d(x)) — 


másrészt 


ami ellentmondás. HI 


4.19. definíció. b c GF(g) gyöke az a(x) polinomnak, ha a(b) — 0. 
4.13. tétel. Ha c az a(x) polinom gyöke, akkor az előáll 
a(x) — b(x)(x— c) 
alakban. 
BIZONYÍTÁS: Alkalmazzuk a 4.12. tételt d(x) — x — c esetén, akkor 
a(x) — b(x)(x— c) 7 e. 


Mivel c gyök, ezért 


4.14. tétel. Egy k-adfokú polinomnak legfeljebb k gyöke lehet. 


BIZONYÍTÁS: A 4.13. tétel miatt a b(x) polinom fokszáma eggyel kisebb, mint 
az a(x) polinom fokszáma, tehát ezt a faktorizációt legfeljebb k-szor lehet megis- 
mételni. HI 


Ezek után be tudjuk már bizonyítani a 4.8. tételt, mely azt állította, hogy min- 
den testben van primitív elem. Először lássunk egy segédtételt! 


4.3. lemma. Ha a B c GF(g) elemek rendje n illetve m relatív prímek, akkor az 
ab elem rendje mn. 
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BIZONYÍTÁS: m és n legnagyobb közös osztóját jelölje (m,n), akkor a feltétel 
miatt (m,n) — 1. Legyen k az aP rendje. (ab) " — (a")"(B")" — 1, tehát k osztja 
mn-t, tehát 

k A mn. 


Ugyanakkor (a8)" — 1, ezért af — B-", így amk — B-"k — 1, tehát a 4.2. lemma 
bizonyítása alapján a rendje n osztja mk-t, ezért (m,n) — 1 miatt n osztja k-t. 
Hasonló módon B" — a-"k — 1, ezért B rendje m osztja nk-t, ezért (m,n) — 1 
miatt m osztja k-t. Ismét (m,n) — 1 miatt tehát mn is osztja k-t, ezért 


mn A k. Ni 


A 4.8. TÉTEL BIZONYÍTÁSA: Azt kell belátni, hogy minden GF(g)-nak van 
primitív eleme. A bizonyítás konstruktív. Ha g — 1 prím, akkor az osztói az 1 
és a g — I, tehát a lehetséges rendek 1 vagy g— 1, mégpedig az 1 elem rendje 
1, a többinek pedig g — I, tehát a GF(g) minden 0-tól és 1-től különböző eleme 
primitív elem. Ha g — 1 nem prím, akkor a prímtényezős felbontása legyen 


§ 
a—1—-[[p 
i—1 


—I 
Mivel a GF(g) nem 0 elemeinek száma g — I és az za polinomnak legfeljebb 
4-1 


1 gyöke van, és — a g—1, ezért létezik a; £ 0 úgy, hogy a," -£ 1. Legyen 


§ 
P; L 
b; — a," 65 p7-[[D:. 
i—I 


Megmutatjuk, hogy b primitív elem. Ehhez először azt látjuk be, hogy b; rendje 


Pi. Nyilván bp? ált— a17! — I, tehát b; rendje a p;" osztója, azaz p"" alakú, ahol 


n; 2 V;. Ha n; 2 V; lenne, akkor 


V—(vj—ny) 


vi 
bj — b; —1, 


(V:—ni) 


4 ho ázag . de ad égiát 2 s ; L 
ezért a D;" minden r; többszörösére b;" — 1, tehát 


pi! 
bi; —1 
lenne, ami nem lehet, mert 


v;—1 g:1 


D; gs BÍS 
bí" -a," 7l, 


4.6. REED-SOLOMON-KÓD 203 


következésképp b; rendje p/:. Alkalmazzuk a 4.3. lemmát (s — 1)-szer, mivel 
bi, ba , . . .  bs olyan elemek, melyek rendjei relatív prímek, akkor b rendje a rendek 
szorzata, azaz 


S 
[I [97 —g-— l, 
i—1 


tehát b primitív elem. ha 


4.6. .  Reced-Solomon-kód 


Ebben a szakaszban a lineáris kódok egyik leggyakrabban használt osztályával, a 
Reed-Solomon-kódokkal, azok különböző konstrukcióival ismerkedünk meg. 


4.1. konstrukció. Legyenek Ow, (4 , . . . , (n-1 a GF(ag) különböző elemei (n £ 9), 
és u — (uo, u1 , . . .  Uk—1) (u; c GF(ag)) a k hosszúságú üzenetszegmens, amelyhez 
az 


u(x) — 40 Hu1x-... 4 ugat 


üzenetpolinomot rendeljük. Ekkor a Reed-Solomon-kódnak az u üzenethez tar- 
tozó n hosszú c kódszavát a következő módon állítjuk elő: 


Co — u(oo) 
CI — u(01) 


C2 — u(0) 


Cn—1 — u(On—1 )- 


Egyszerűen belátható, hogy a Reed-Solomon-kód lineáris, és a generátormát- 
Trixa 


1 1 1 1 
1020) 01 02 "tt"  On-I 
G — 
k-1 .k-I 4k—I k—1 
Og ei 07 LYI 


4.15. tétel. Az (n,k) paraméterű Reed-Solomon-kód kódtávolsága 
dmn—n-—kil, 


vagyis a Reed-Solomon-kód maximális távolságú. 


204 4. HIBAJAVÍTÓ KÓDOLÁS 


BIZONYÍTÁS: 
w(c) — ](cnem 0 koordinátái )] — 
— nd— ](fc0 koordinátáit] 2 
2 n—7 liulx) gyökeij] 2 
2 n—- (k Bi 1), 
tehát 


Wmin 3 1—ki-1. 
Ugyanakkor a 4.1. tétel és a 4.4. tétel miatt 
n—k4 12 dmin — Wmin, 
következésképp az állítást bebizonyítottuk. HI 
Az (n,k) paraméterű Reed-Solomon-kód tehát n — k hibát tud jelezni, 5] 


egyszerű hibát javítani és n —k törléses hibát javítani. Ez utóbbi azt is jelenti, 
hogy az u ismeretlenre vonatkozó 


uG — c 


n darab egyenletből bármelyik n —k egyenlet elhagyásával egy egyértelműen meg- 
oldható egyenletrendszer marad, tehát a G mátrix minden k x k-s négyzetes rész- 
mátrixa invertálható. Ez utóbbi állítás igazolható úgy is, hogy felismerjük, misze- 
rint G minden k x k-s négyzetes részmátrixa Vandermonde típusú. 


4.2. konstrukció. Legyen a a GF(g) egy nem 0 eleme, melynek rendjem,m2 n 
és a 4.1. konstrukcióban legyen ag — 1, o — ax, . . . , 0.1 — 0-1. Ekkor a gene- 
rTátormátrix: 


1 1 1 : 1 
1 a az a! 
G-Í[ 1 oz al a2(n-1) 
1 ak-1i  g2(k-1) a(k—1) (n—1) 
4.3. konstrukció. A c — (co, ci, . . . , n—1) vektorhoz rendeljük hozzá c(x) polino- 


mot a szokásos módon: 


c(x)— cg cIx- tt ken ax. 
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Ha az a elem rendje m, és n £ m, akkor a kód definíciója 
C — fe: c(oi) —0, i— 1,2,...,n—k). 
Egyszerűen belátható, hogy a C kódnak ez a megadása ekvivalens a következővel: 


C — (c: Hc" —0], 


ahol 
1 a az o! 
1 02 a ...  a2(n-0) 
H — 
1 oar-k a2(m—R ...  a(r—k(n—1) 


Bebizonyítjuk, hogy ez a kód maximális távolságú, és n — m esetén ez a kód 
azonos a 4.2. konstrukcióban leírt Reed-Solomon-kóddal. (Az irodalomban n a m 
esetén a 4.2. konstrukció kódját rövidített Reed-Solomon-kódnak nevezik.) Elő- 
ször azt mutatjuk meg, hogy a C kód maximális távolságú. Ennek érdekében 
előbb a paritásmátrixok egy hasznos tulajdonságát bizonyítjuk: 


4.4. lemma. Ha H egy lineáris C kód paritásmátrixa, akkor H azon oszlopainak 
minimális száma, melyek lineárisan függők, d min. 


BIZONYÍTÁS: Írjuk fel H oszlopait! 


H— (ag al, ali), 


akkor a paritásegyenlet c — (co, c1, . . . , n—1) jelöléssel: 
Coao tCIda1-... pe ga — 0. 


Ezt az egyenletet csak olyan nemnulla c vektorok (kódszavak) elégíthetik ki, me- 
lyek súlya legalább wmin, ilyen súlyú viszont van, tehát a lineárisan függő oszlo- 
pok minimális száma wmin, amely a 4.4. tétel miatt éppen dmin. 

h. 


Erre alapozva már szinte készen vagyunk. Ha a 4.2. konstrukcióban a G kép- 
letében k helyett (n — k)-t írunk, akkor annak minden (n— k) x (n— k)-s rész- 
mátrixa invertálható. Ha egy ilyen részmátrixot összehasonlítunk a H ugyan- 
ezen oszlopokból álló részmátrixával, akkor vegyük észre, hogy az egymásnak 
megfelelő oszlopok egy nem 0 elem faktorban különböznek, tehát a H minden 
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(1—k) x (n—k)-s négyzetes részmátrixa invertálható, ezért minden n — k oszlopa 
lineárisan független. A 4.4. lemma miatt tehát 


n—k a dmin, 


azaz 
n—ki1l £ dmin; 


ezért ismét a Singleton-korlátot alkalmazva készen vagyunk. 

Eddig azt mutattuk meg, hogy H egy (n,k) paraméterű MDS kód paritásmát- 
rixa. Mivel mind a 4.2. mind a 4.3. konstrukció (n,k) paraméterű, ezért a kettő 
azonosságához elég megmutatni, hogy a 4.3. tartalmazza a 4.2.-t. A 4.2. konst- 
rukció egy kódszavának i-edik koordinátája 


k—1 
cp— YA ujj , 0OCidgn-l. 
j—0 


Megmutatjuk, hogy az így megadott kódszó kielégíti a 4.3. konstrukció paritás- 
egyenletét, azaz 


n—1 
Ec!-0o, 1c1£n-k. 
i—0 


A c definícióját felhasználva 








n—1 : n—1k—I Vo. k—1 n-I 
b ce! — y Je uja] tet y uj 9: ai 
1—0 1—0 j—0 j-0 — í—0 
MivelOC£jCk—lés1 £1Xn-k, ezért 1 £ jr €n—1, tehát Jt! -£ 1 és 
—1 j-HI j--I 
9 aan gat Tel seg Sz esz 
; ojta1 — oajtH—al 7 
i7-0 
következésképp c kielégíti a paritásegyenletet. B 


Példaként a digitális hangrögzítésben (CD és DAT) alkalmazott Reed-—Solo- 
mon-kódot említjük [2, 35, 16, 24, 7]. A kódolási eljárás lényegét közelítőleg a 
következő módon lehet összefoglalni: a 44.1 kHz-cel mintavételezett és 16 bitbe 
kvantált mintákat két bájtban ábrázoljuk, és egy mátrixba írjuk be oszlopfolyto- 
nosan. 
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rögzítés iránya 








8 
XI.  X71 0 XI34 s-t XI391 Fi4j FI2 FI3 TIA 
X12 X72 XI32 :""" XI392 Ma TF22 P3 TF2A4 
s YXI1 971 0 NYI3A "tt YI391 F3i TFT32 TF33 TF3A 
§ YXI12 72 NY132 :"" NX1392 Fal Tal Taz3 TF44 
e 
8 
DD 
- 
cö 
S 
§g 
§ X61 XI21 XI84 "rt XI441 F2i TF212 TF23 TF2IA 
X62 XI22 XI82 """ XI442 F2an F22 F23 TF2A 
Y61 NI21 NI8I """ Ni44l F231 F232 TF233 F234 
Y62 N122 N182 :""" NY1442 F24i TF242 TF24a3 TF244 
did dií2 dií3 :"-"" 9124 49125 di26 di27 91.28 
gd21 d22 §d23 ""  d224 9225 d226 d227 9d228 
gd31 §d32 933 :""" 9324 9325 9326 d327 9328 
Tt d4ai d42 43 :":" da24 425 9426 9427 4428 


Nevezetesen egy 24 x 24-es mátrix oszlopai egymásután következő 6 minta- 
vételi időpontban vett két minta (bal és jobb hangcsatorna) 2 x 2 — 4 bájtját tar- 
talmazzák. Ha x; 1, xi.2 jelöli a jobb csatorna mintáját az i-edik időpillanatban, és 
Yi 1, Yi,2 a bal csatornáét, akkor a fenti ábra mutatja a minták beírását a táblázatba. 
A kapott 24 x 24-es mátrix minden oszlopát kódoljuk egy (28,24) paraméterű, 
GF(25) feletti szisztematikus Reed-Solomon kóddal. A j-edik oszlop paritásbájt- 
jait jelöltük g1. j , g2., j , d3, j , da, j-vel. Ennek a kódnak a kódtávolsága 5, tehát 4 hibát 
tud jelezni, 2 egyszerű hibát tud javítani és 4 törléses hibát tud javítani. A digi- 
tális lemezen előforduló hibák jól modellezhetők egy kétállapotú csatornával. Az 
egyik állapotot nevezzük JÓ állapotnak, melyben átlagosan 10000-20000 bitideig 
tartózkodik, és ekkor a hibák előfordulása független egymástól és valószínűsége 
kb. 1071. A másik állapotot nevezzük ROSSZ állapotnak, amiben 30-40 bit- 
ideig tartózkodik, és ekkor gyakorlatilag használhatatlan a vétel. Ekkor azt mond- 
juk, hogy a hibázás csomós (burst-ös). Az ilyen csatornák kódolására találták 
ki a kódáttűzés (interleaving) technikát, amikor az előbbi mátrixot sorfolytono- 
san olvassák ki, de előtte minden sort kódolnak ugyanazzal a (28, 24) paraméterű 
Reed-Solomon-kóddal. A j-edik sor paritásbájtjait jelöli rj 1, rj2,Tj.3,T ja. Ennek 
előnye az, hogy a fizikailag összefüggő, csomós hiba hatását több kódszóra osztja 
szét. 

A Sony és a Philips megegyezett a fentihez hasonló (kicsit bonyolultabb) kó- 
dolásban azért, hogy a tömeges digitális hanglemezgyártás elindulhasson. A ver- 
seny nyitott viszont a lejátszó készülékben, vagyis a dekódolás terén. A külön- 
böző dekódolások igaziból a következő egyszerű eljárás finomításai: számítsuk ki 
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soronként a szindrómát! Ha a szindróma 0, akkor azzal a sorral készen vagyunk. 
Ha 1 hiba volt, akkor azt kijavítjuk. Ha 2 hiba volt, akkor azt kijavítjuk, és az osz- 
loponkénti javításhoz ezeket a hibahelyeket megjegyezzük, azaz mesterségesen 
törléses hibákat generálunk. Minden egyéb esetben az egész sort törléses hiba- 
ként regisztráljuk. Ezek után oszloponként javítunk, ha ott legfeljebb két törléses 
hiba volt (emlékeztetünk, hogy 4 törléses hibát képes a rendszer javítani). Ha a hi- 
bák száma nagyobb, mint 2, akkor a környező hibátlan mintákból interpolálunk. 
Látható, hogy a hibajavítás nem használja ki a Reed-Solomon-kód hibajavítási 
lehetőségeit, aminek elsősorban technológiai okai vannak, mivel a dekódolás bo- 
nyolultsága a javítandó hibák számának négyzetével arányos, és itt igen gyorsan 
kell dekódolni (a forrás sebessége 2 - 44100 - 16 — 1.4112 Mbit/sec) 


4.7. . Aritmetika GF(p")-ben 


A 4.3. szakaszban említettük, hogy lényeges különbség van a prím illetve prímhat- 
vány méretű testek aritmetikája között. Prím méretű testben a modulo aritmetika 
megfelelt. Prímhatvány méret esetén sajnos a modulo aritmetika nem teljesíti a 
testaxiómákat, például egy 4 elemű halmazban 2-2 mod 4 — 0, tehát két nem 
0 elem szorzata 0 lenne, ami sérti a 2. a) axiómát. A GH(p") feletti aritmetika 
konstrukciója azért alapvető fontosságú, mert manapság a hibajavító kódokat tö- 
megesen alkalmazzuk számítástechnikai környezetben, ahol a természetes ábécé 
a GF(25), vagyis a bájt. Az előző szakasz végén szereplő digitális hangtechnikai 
példában is GF(29) volt az ábécé. 

A GH(p")-beli elemek legyenek a 0, I , . . . , 0" — 1] számok, melyeknek m hosz- 
szú vektorokat feleltetünk meg, ahol a koordináták GF(p)-beliek. Ezt megfogal- 
mazhatjuk például úgy is, hogy a 0, 1, . . . , p"" — 1 számokat p-s számrendszerben 
írjuk fel. Ezek után a GH(p")-beli aritmetikát m hosszú vektorok közötti műve- 
letekkel definiáljuk. A két művelet közül az összeadás az egyszerűbb: két vektor 
összegén a koordinátánkénti GH(p)-beli összeget értjük, vagyis a koordinátánkénti 
mod p összeget. A szorzás egy kicsit bonyolultabb. A két m hosszú vektort leg- 
feljebb (m — 1)-edfokú polinom formájában reprezentáljuk, és összeszorozzuk. 
Az eredmény fokszáma meghaladhatja (m — 1)-et, ezért itt egy speciális polinom 
szerinti maradékot képezünk. Ezt a speciális polinomot irreducíbilis polinomnak 
nevezzük, és ez a polinom ugyanolyan szerepet játszik, mint a prímszám a GH(p)- 
beli aritmetikában. 


4.20. definíció. A GK(P) feletti, nem nulladfokú P(x) polinomot irreducíbilis 
polinomnak nevezzük, ha nem bontható fel két, nála alacsonyabb fokú GHp) 
feletti polinom szorzatára, azaz nincs GKp) feletti a1(x) , a2z(x) polinom, melyekre 
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P(x) — a1(x) : a2(x) 


0 a deg(a;j(x)) c deg(P(x)), 12. 


Bizonyítás nélkül megjegyezzük, minden véges testben található tetszőleges 
fokszámú irreducíbilis polinom. Példát mutatunk viszont arra, hogy hogyan lehet 
GEC2) feletti irreducíbilis polinomokat generálni. A definícióból következik, hogy 
minden elsőfokú polinom (x és x -- 1) irreducíbilis. Ha találunk olyan másodfokú 
polinomot, mely különbözik az x?, az x(x-- 1) és az (x-- 1)? mindegyikétől, akkor 
találtunk irreducíbilis másodfokú polinomot. Egy ilyen van: x? 3-x-H1. Más 
testben és nagyobb fokszám esetén ennél hatékonyabb konstrukciókat érdemes 
használni, de bináris esetben így is találhatók irreducíbilis polinomok, amelyeket 
táblázatban foglalunk össze: 

















fokszám irreducíbilis polinom 
2 x"3x-rl 

3 x34xil 

4 x4xil 

5 xx 11 

6 x54x-41 

7 x" 3x 11 

8 xx xx 
9 x? 1-xt 31 











4.16. tétel. Legyen p egy prím, m egy természetes szám, P(x) egy GK) feletti 
m-edfokú irreducíbilis polinom és 0 — (0, 1,...,p"—1). Egy a ec 0-nak és b c 0- 
nak kölcsönösen egyértelműen feleltessünk meg GKp) feletti, legfeljebb (m—1)- 
edfokú polinomot. a-b definíció szerint az a c c 0, melynek megfelelő c(x) 
polinomra 


c(x) — a(x) 4 b(x). 


a: b azad c O, melynek megfelelő d(x) polinomra 
d(x) — (a(x) :b(x)) mod P(x). 


Ezzel az aritmetikával 0 egy GKp"). 
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4.9. példa. Készítsük el a GF(29-beli aritmetikát! Tudjuk, hogy a P(x) — x? 4 
x-1 egy másodfokú irreducíbilis polinom. A kölcsönösen egyértelmű megfelel- 
tetéseket egy táblázatba foglaljuk össze: 


testelemek m — 2 hosszú vektorok polinomok 


0 00 0 
1 01 1 
2 10 x 
3 11 xi 


Az összeadást egyszerűen a 2 hosszú vektorok koordinátánkénti bináris ösz- 
szegével kapjuk. Nézzünk a szorzásra példát! 2 : 3-at úgy számoljuk ki, hogy a 
2-nek és a 3-nak megfelelő polinomot összeszorozzuk, és vesszük a P(x) szerinti 
maradékot: 

x(xH1)—1 (modx? xi 1), 


amely megfelel az 1 testelemnek. Az összeadó és a szorzó tábla ennek megfele- 
lően a bináris vektorokra: 


zt 00 0Ol1 10 II : 00 Ol 10 II 
00 00 01 10 1I 00 00 00 00 00 
01 01 00 II 10 01 00 01 10 II 
10 10 1I 00 01 10 00 10 II 01 
11 II 10 OI 00 11 00 II OI 10 


majd testelemekre 


FOL 23 " 0123 
00123 00000 
1 1 0 3 2 10123 
2 2 30 1 2022 31 
33210 30 3 1 2 


A 4.3. szakaszban már említettük, hogy primitív elem alapú logaritmustábla és 
inverzlogaritmus-tábla segítségével egyszerűsíthető a szorzás. A fenti szorzótábla 
segítségével ellenőrizhető, hogy mind a 2, mind a 3 primitív elem. Válasszuk a 


2-t! Ekkor 


logaritmustábla inverzlogaritmus-tábla 
testelem log egészek invlog 
1 3 1 2 
2 1 2 3 


3 2 3 1 
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Ezt felhasználva 2 - 3 — 2192(2:3) — 210g2-Hog3 — 21-42 — 23 — 1 (itt jela mod g—1 
összeadást jelöli). 


Hátra van még a 4.16. tétel bizonyítása. Ehhez először egy segédtételt bizo- 
nyítunk: 


4.5. lemma. Ha P(x) egy GKP) feletti irreducíbilis polinom, és osztja a(x)b(x)- 
et, akkor legalább az egyik tényezőt osztja. 


BIZONYÍTÁS: Egy p(x) polinomot főpolinomnak nevezünk, ha a legmagasabb 
fokú tagjának az együtthatója 1. Az a(x) és b(x) polinomok legkisebb közös 
többszöröse legyen az az [a(x), b(x)] minimális, de pozitív fokszámú főpolinom, 
amelynek a(x) és b(x) is osztója. Egyszerűen belátható, hogy a legkisebb kö- 
zös többszörös minden közös többszörösnek osztója. A lemma bizonyításához 
tegyük fel, hogy P(x) az a(x)-nek nem osztója, akkor egyrészt a(x) A 0, másrészt 
a P(x)a(x) egy közös többszörös, mely felírható 


alakban, ahol deg(d(x)) 5 0, azaz 


P(x) —g(x)d(x), 


tehát g(x) a P(x) osztója. Mivel P(x) irreducíbilis, és deg(d(x)) 5 0, ezért 
deg(g(x)) — 0, azaz g(x) — go alakú. Mivel a(x)b(x) az a(x)-nek és P(x)-nek 
is többszöröse, ezért felírható 


a(x)b(x) — h(JIPG) al — hdag PGJat) 
alakban, azaz b(x) — h(x)az! P(x), tehát P(x) osztja b(x)-et. Hi 
A 4.16. TÉTEL BIZONYÍTÁSA: A testaxiómákat egy kivételével egyszerű iga- 
zolni, ha észrevesszük, hogy a nullelem az azonosan 0 polinom, és az egységelem 
az azonosan 1 polinom. Egyedül az igényel részletesebb meggondolást, hogy 
minden nemnulla a(x) polinomnak van multiplikatív inverze, azaz létezik b(x) 


polinom, melyre 
a(x)b(x)—1 mod P(x). 


Tekintsük a következő két halmazt: 
A — (f(x) : deg(f(x)) Cm—1), 
B — fa(x) f(x) mod P(x): deg(f(x)) Cm—1]. 
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Nyilván B az A részhalmaza, hiszen A egy f(x) eleméhez a B egy elemét rendeltük 
az a(x) f(x) mod P(x) leképezéssel. A fenti b(x) létezését belátjuk, ha megmutat- 
juk, hogy A — B, azaz az a(x) f(x) mod P(x) leképezésünk invertálható. Tegyük 
fel, hogy nem az, azaz létezik két különböző f1(x) € A és fo(x) e A úgy, hogy 


a(x)fi(lx) mod P(x) — a(x) fo(x) mod P(x) 


tehát P(x) osztja a(x) fi(x) — a(x) folx) — a(x)(fi(x) — fo(x))-et. A 4.5. lemma 
miatt P(x) vagy a(x)-et vagy (fi(x) — fo(x))-et osztja. P(x) nem oszthatja a(x)- 
et, mert az utóbbi nem 0, és a fokszáma kisebb, mint a P(x) fokszáma. Mi- 
vel fi(x) — f(x) fokszáma is kisebb, mint P(x)-é, ezért P(x) csak akkor osztja 
(f1(x) — fo(x))-et, ha fi(x) — fo(x) — 0, ami ellentmond annak a feltételünknek, 
hogy fi(x) és f2(x) különböznek. h. 


4.8.  Ciklikus kódok 


4.21. definíció. Egy 
c — (Co, CL): hula ,Cn-1) 


vektor ciklikus eltoltja a 
9 (Cn—1, CO, éti ,Cn—2). 
5-et a ciklikus eltolás operátorának nevezzük. 


4.22. definíció. A C kódot ciklikusnak nevezzük, ha bármely kódszó ciklikus el- 
toltja is kódszó. 


4.10. példa. Legyen C a 
000 
101 
110 
011 
111 


vektorok halmaza. Egyszerűen belátható, hogy C ciklikus. Megjegyezzük, hogy 
a ciklikusságból nem következik a linearitás, például a 2. és az 5. kódszó összege 
010, ami nem eleme a kódnak. 


A ciklikus eltolás operátorát kényelmesebben tudjuk kezelni, ha a kódszavakat 
mint vektorokat a már megszokott polinomos formában reprezentáljuk. 
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4.23. definíció. Rendeljünk polinomot az egyes kódszavakhoz a következő mó- 
don: 


€— (Co C1,...,Cn-1) Fo c(x) — cg bcixt tben ax TT, 


ekkor a c kódszónak megfeleltetett c(x) polinomot kódszópolinomnak vagy rövi- 


den kódpolinomnak nevezzük. A kódszópolinomok halmazát C(x)-szel jelöljük. 
4.6. lemma. Legyen c"(x) a c kódszó Sc eltoltjához rendelt kódszópolinom, ekkor 
c" (x) — [xc(x)] mod (x" — 1). 
BIZONYÍTÁS: Legyen c(x) — cg -cix-b tr cnn. 1x! , ekkor 
xc(x) — cn-1(x"— 1) 3- c (x), 


ahonnan az állítás következik, mert deg(c"(x)) £n— 1. ha 


4.17. tétel. Minden (n, k) paraméterű, ciklikus, lineáris C kódban a nem azonosan 
nulla kódszópolinomok között egyértelműen létezik egy minimális fokszámú g(x) 
főpolinom. g(x) fokszáma n — k, és egy c € C akkor és csak akkor, ha g(x) ] c(x), 
azaz létezik egy u(x) polinom úgy, hogy c(x) — g(x)u(x). 


BIZONYÍTÁS: A nem nulladfokú kódszópolinomok között biztosan létezik leg- 
kisebb fokú. Legyen egy ilyen 


g(x) — Co tcixT rt cxT. 


Mivel a kód lineáris, ezért a 

81) — cat) 
is kódpolinom és minimális fokszámú főpolinom. Be kell látnunk az egyértel- 
műséget. Tegyük fel, hogy van kettő: g/"(x) és g7(x), akkor a linearitás miatt a 
különbségük is kódszópolinom, és r-nél kisebb fokszámú, ami lehetetlen. A cik- 
likusság miatt g(x), xg(x),x"g(x), . .. xx! g(x) is kódszópolinom, ezért ismét a 
linearitás miatt tetszőleges (uo, 11 , . . . , Wn—r—1 )-Te 


(40-EUIX esne) ex) 
is kódszópolinom, azaz 


n-r—1 
u(Xx) — ug HF U1X, . . . ,Un-r—1X 


jelölés esetén u(x)g(x) kódszópolinom. A másik irányú állítás az, hogy ha c(x) 
egy tetszőleges kódszópolinom, akkor g(x) osztja c(x) polinomot. Az euklidészi 
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osztási tétel miatt ugyanis c(x) — g(x)g(x) 4-r(x), ahol deg(r(x)) c deg(g(x)). Ez 
csak úgy lehet, ha r(x) — 0, mivel r(x) — c(x) — g(x)e(x) is kódszópolinom és 
£(x)-nél kisebb fokszámú. Így r(x) csak 0 lehet. Ebből viszont következik, hogy 


minden kódszópolinom előáll (uo -- u1x, . . . , Un-r— ax 2 )g(x) alakban. Másrészt 
egy (n,k) paraméterű kódban g" darab kódszó van, ahonnan következik, hogy 


r—n-k. Hi 


4.24. definíció. g(x)-et a kód generátorpolinomjának nevezzük. 
4.18. tétel. Minden ciklikus, lineáris kód g(x) generátorpolinomjára 


gt) lx—1. 


Másrészről, ha egy g(x) főpolinomra g(x) I x" — 1, akkor létezik egy lineáris cik- 
likus kód, melynek g(x) a generátorpolinomja. 


BIZONYÍTÁS: Miutánx"7!g(x) (n—1)-edfokú főpolinom, annak eltoltja x.g(x) — 


(x" — 1). Mindkettő kódszópolinom, tehát ez utóbbi is osztható g(x)-szel, más- 
részt x"g(x) is osztható g(x)-szel, ezért a kettő különbsége is osztható g(x)-szel, 
ami viszont éppen x"— 1. Az állítás második felét is egyszerű belátni. Legyen 
£(x) fokszáma n — k, akkor a kódszópolinomok 


C(x) — fc(x) — a(x)g(x); deg(a(x)) Ck—1) 


halmaza egy (n,k) paraméterű lineáris kódot definiál. Meg kell mutatni, hogy 
ez ciklikus, azaz c(x) — a(x)g(x), deg(a(x)) c k— 1 esetén eltoltja is kódszó- 
polinom, azaz létezik a!"(x), deg(a"(x)) Ck—1, úgy hogy xc(x) — a(x)e(x) 
mod (x" — 1). Ha deg(a(x)) c k— I, akkor legyen a" (x) — xa(x). Ha deg(a(x)) — 
k — 1 és legmagasabb fokú tagjának együtthatója ax. 1, akkor xc(x) előáll 


xc(x) — xa(x)e(x) — ak—1(x" — 1) 4 b(x) 


alakban, ahol deg(b(x)) Cn— 1. Ha g(x) osztja x" — 1-et, akkor osztja b(x)-et is, 
tehát az a"(x)g(x) alakú, ezért 


xc(x) — a (x)g(x) modx"—1. Hi 


A ciklikus kódok előnyös tulajdonságai egyrészt a generálási lehetőségek sok- 
féleségében, másrészt egyszerű dekódolási eljárásokban jelentkeznek. Egy line- 
áris ciklikus kódot lehet például a generátorpolinom és az üzenetpolinom szor- 
zásával generálni. Ez a módszer megfogalmazható egy olyan G generátormátrix 
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segítségével is, amelyhez legegyszerűbben úgy juthatunk el, ha G sorai a g(x)-nek 
megfelelő vektor eltoltjai: 


80 81 82 ::" 8n-k-i 1 0 --. 0 

0 go gi :" 8n-k—2 8n-ki 1 0 
G—[ : : : : j j : : [; 

0 0 0 ... 20 21 gt 1 0 

0 0 0 --. 0 go — gi :"  g8n-ka 1 


kihasználva, hogy g(x) főpolinom, így gn-xk — 1. 
Egy másik generálási módszer kapcsán azt is megmutatjuk, hogy 


4.19. tétel. Minden lineáris ciklikus kód generálható szisztematikusan. 


BIZONYÍTÁS: Vegyük észre, hogy go - 0, mert ha 0 lenne, akkor a g-t balra 
eltolva g-nél 1-gyel kisebb fokszámú kódszópolinomot kapnánk, ami lehetetlen. 
go 7 0 miatt viszont a Gauss-eliminációt balról jobbra végrehajtva szisztematikus 
generátormátrixot kapunk. HI 


A szisztematikus generálás egy praktikus módszere a következő: 
Legyen u(x) egy legfeljebb (xX — 1)-edfokú üzenetpolinom és 


c(x) — ult — [ul] mod g(x), 
akkor c(x) kódszópolinom, mivel c(x) — 0 mod g(x). Ezen generálás szisztema- 


tikus: a c(x)-et definiáló egyenlőség jobb oldalának első tagja adja az üzenetszeg- 
menst, míg a második tagja a paritásszegmenst. 


4.11. példa. Tekintsük a GF(2) feletti g(x) — 1--x--x? polinomot! Mivel 
x7—1—(13-x0)(14x-x)(1--x7 2), 


ezért g(x) osztja (x" — 1)-et, tehát g(x) egy (7,4) paraméterű bináris, lineáris, cik- 
likus kód generátorpolinomja. Egy generátormátrixához jutunk a g(x) eltoltjaival: 


FO 
DEE OO 
FO OO 
a mi DD 
DEE E OO 
DO EE 
DPOO- E 
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A második módszer szerinti szisztematikus generátormátrixhoz úgy jutunk el, ha 
kiszámítjuk az [őt] mod (1 --x--x?) maradékokat i — 0, 1, 2, 3-ra, melyek 


xX —- 1-4x mod(134x4X) 

xx - x(14x-tx)—x(17-x) — 
x(1-7-x) — 

xx? mod (1-4-x-x) 

x x2(17-x-x?) — ax (1-4 x) — 
x-(1-4x) — 

— 1-4x-i4x" mod (1 4xt) 
x5 — x3(17xx)—x (1-4) — 
xx — 

Hxtx-x — 
— 1-kx? mod(1--x-4x) 








I 
zi 
I 





Ezek alapján 
1000101 
G — 010011 1 ; 
001010 
0001011 


amely a már jól ismert (7, 4) paraméterű Hamming-kód szisztematikus generátor- 
mátrixa. 


A paritásmátrixnak is van polinomos megfelelője: 


4.25. definíció. Egy 9(x) generátorpolinomú lineáris, ciklikus kód esetén a 


1 A 





polinomot paritásellenőrző polinomnak nevezzük. 
4.20. tétel. Egy lineáris, ciklikus kódra c(x) akkor és csak akkor kódszópolinom, 


ha 
c(x)h(xy— 0 mod(x"—1) 


deg(c(x)) £n—-1l. 
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BIZONYÍTÁS: Ha c(x) kódpolinom, akkor c(x) — u(x)e(x) alakú, tehát 


cGx)h(x) — ut) gbahlx) — ut) — 1), 


tehát c(x)h(x) — 0 mod (x"— 1). Ha viszont c(x)h(x) — 0 mod (x" — 1), akkor 
c(x)h(x) — a(x)(x" — 1) alakú, ahonnan 


c(x) — at) — 1)/h(x) — a(x)8 09, 
tehát c(x) kódpolinom. NI 


4.21. tétel. A Reed-Solomon-kódok 4.3. konstrukciójában legyen az n kódszó- 
hossz egyenlő az ott szereplő a elem m rendjével. Ekkor a kód ciklikus, és gene- 
rátorpolinomja 


tehát a nem rövidített Reed-Solomon-kód ciklikus. 


BIZONYÍTÁS: A 4.3. konstrukciót a paritásmátrixával adtuk meg, és a kódszavak 
kielégítették a paritásegyenleteket: 


n—-1 .. 
ND cja/ —0, i—1,... n—k, 
j—0 


tehát ol , . . . ok gyöke a c(x) polinomnak, vagyis c(x) felírható 
n—-k 


c()—[[£—90)u) 
i—1 
alakban. A g(x) tételbeli definíciójával az tényleg egy ciklikus kód generátorpo- 
linomja, ha megmutatjuk, hogy osztja az (x" — 1)-et. Ez utóbbi azért igaz, mert 
g(x) gyökei az (x" — 1)-nek is gyökei, ugyanis 


(oiy" (oi)" aim (o); 1, 








ezért n § 
xX—-1-[[6— 0), 


i—1 


ahonnan a h(x)-re vonatkozó állítás is következik. HI 
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A ciklikus kódok gyakorlata a leghosszabb múlttal a hibajelzés területén ren- 
delkezik, amikor a kód bináris, a kódokat a szabványok generátorpolinomjuk se- 
gítségével adják meg és generálásuk a 4.19. tétel bizonyításában leírt módon, a 
generátorpolinom szerinti maradékos osztással, szisztematikusan történik. Ezeket 
a kódokat CRC kódoknak hívják (Cyclic Redundancy Check). A hibajelzést leg- 
többször zajos, visszacsatolásos csatornáknál használják, amikor a vevő hiba de- 
tektálása esetén értesíti az adót, amely ezután az adást ugyanazzal a kóddal vagy 
egy jobbal megismétli. Ezt az eljárást ARO-nak nevezzük (Automatic Repeat 
reOuest). 

A CCITT 16 paritásbitet tartalmazó szabványában a CRC generátorpolinomja 


g1(x) — x16 px po 1. 


Ezt a generátorpolinomot alkalmazzák pl. az SNC 2653 (Polinomial Generator 
Checker), INTEL 82586 (Local Communication Controller), INTEL 8274 (Multi- 
Protocol Serial Controller), Signetics 2652 (Multi-Protocol Communications Cir- 
cuit) integrált áramkörökben. A két utóbbiban még választhatjuk a 


g2(x2) —x54x5 1 


polinomot is. Az INTEL 82586-os Ethernet chip tartalmaz egy 32 bites generá- 
torpolinomot is: 


10 8 7 9. 4 2 





g3(x) —x BXFXA FX FX FX TX txt]. 

A 4.18. tétel értelmében ezek a polinomok akkor generátorpolinomjai ciklikus 
kódoknak, ha osztják az x" — 1 polinomot, tehát csak bizonyos kódszóhosszakra 
ciklikus kódok. Ugyanakkor erre nem figyelmeztetik a felhasználót. Ez azért 
nem okoz problémát, mert tetszőleges üzenethossz esetén azért jó kódot kapunk, 
ugyanis az vagy eleve ciklikus, vagy egy ciklikus kód rövidítése. Legyen C egy 


(n,k) paraméterű szisztematikus lineáris kód és k" a k. Egy 
u" — (ug, 1... u) 
üzenethez rendeljük a k hosszú 
u — (0,0,..., 0, ug, u, ..., u) 
üzenetet, ahhoz a 


4 1 1 
c — (0,0,...,O,Ug,U4, . . . , Ui, Ck415 Ck-4r2  : Cn) 
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kódszót és ahhoz a rövidített kódszót: 
€C" — (10, U1, . . . , Ur, Ck4r15 Ck2) hr 4 Cn)- 
Az ilyen c! kódszavak C" halmazát nevezzük a C kód rövidített kódjának. Nyilván 
n—n -k—k 


és C" kódtávolsága legalább akkora, mint a C kódé. 

Ez utóbbi miatt elég összefoglalni a CRC kódok alapvető tulajdonságait akkor, 
amikor az ciklikus kód, azaz az n kódszóhosszra a generátorpolinom osztja x"— 1- 
et. 

Ezek után legyen n az a legkisebb természetes szám, melyre g1(x) ] x" — 1, és 
jelölje C az (n,n — 16) paraméterű, ciklikus, lineáris kódot, melynek a generátor- 
polinomja g1(x), ekkor 


1. tulajdonság: n — 25 — 1 — 32767. 
2. tulajdonság: C jelez minden legfeljebb 3 súlyú hibát. 
3. tulajdonság: C jelez minden páratlan súlyú hibát. 


4. tulajdonság: C jelez minden olyan hibát, ahol a hibahelyek maximumának 
és minimumának a távolsága kisebb, mint 16. (Ez utóbbit úgy szokás mon- 
dani, hogy a kód jelez minden legfeljebb 16 hosszú hibacsomót.) 


BIZONYÍTÁS: Az 1. bizonyítása egyrészt történhet további matematikai appará- 
tus bevezetésével, másrészt számítógépes ellenőrzéssel. 

Ha a v vett szónak, az e hibamintának és a küldött c kódszónak rendre a v(x), 
e(x) és c(x) polinom felel meg, akkor 


v(x) — c(x) te(x) 


miatt C egy olyan e hibát tud jelezni, melyre g1(x) nem osztja e(x)-et. Mivel 
81(1) — 0, ezért 
8119 —(x—Dg() 

alakú. Ha e-ben páratlan sok 1 van, akkor e(1) — 1, tehát x— 1 nem osztja e(x)-et, 
ezért g1(x) sem osztja e(x)-et, és ezzel a 3. tulajdonságot beláttuk. 

Mivel g1(x) kódszópolinom és a súlya 4, ezért a C kódtávolsága legfeljebb 4, 
tehát C legfeljebb 3 hibát jelezhet. A 3. tulajdonság miatt az 1 és a 3 súlyút jelzi, 
tehát elég megvizsgálni a 2 súlyú hibákat. Ha e 2 súlyú, akkor 


e(x)— xx 
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alakú, ahol 0 Ci c j £n—l1. g1(x) ] e(x), ha 
xx 1) — gib9zt) 


alakú. Írjuk fel z(x)-et 
z(x) —x"z(x) 


alakban, ahol x nem osztja z"(x)-et, azaz 

x(x1— 1) — ax gi (hz (2). 
Ha i - m lenne, akkor 

(1) — gi (9z 0), 


tehát x ] g1(x)z(x), ami lehetetlen, mert x nem osztja z"(x)-et és g1(0) — 1 miatt x 
nem osztja g1(x)-et. Ha i £ m lenne, akkor 


x1a1—x—1—gi(9z(T, 


ami szintén lehetetlen, mert n volt az a legkisebb egész, melyre g1(x) [ x"— 1, már- 
pedig j—i a n, ezért g1(x) nem oszthatja (x/-! — 1)-et. Ezzel a 2. tulajdonságot 
is beláttuk. 

A 4. tulajdonsághoz legyen 


ahol i 2 0 és deg(e(x)) c 16. Ha g1(x) I e(x). akkor 


i 


xe(x) —gi)z (xx 
alakú, ahol x nem osztja z"(x)-et. i C m nem lehet, mert ekkor 


m—i 


e (x2) — Bi LIZ JT, 
tehát g1(x) a nála kisebb fokszámú e"(x)-et osztaná. i 5 m sem lehet, mert ekkor 
x-el(x) — gibJz(), 


azaz x osztaná g1 (x)z (x)-et, ami szintén lehetetlen a 2. tulajdonság bizonyításában 
elmondottak miatt. 

Az 1., 2., 3. és 4. tulajdonság mindegyike áll a g2(x) polinom esetén is. A 2., 
3. és 4. tulajdonságot be lehet látni minden g(x) — xl6 [ xj4.xi 3-1 alakú generá- 
torpolinomra, ahol 16 5 j 5 i 5 0. Nyilván fontos, hogy az az n, melyre g(x) egy 
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n hosszú ciklikus kód generátorpolinomja, elegendően nagy legyen, tehát a gya- 
korlatban választott üzenethossz a kód egy rövidítésének üzenethossza legyen. 
Belátható, hogy az ilyen g(x)-ek közül a g1(x) és a g2(x) esetén a legnagyobb az 
n. ha 


A 4.2. szakasz végén említettük, hogy a műholdas műsorszórás szolgáltatás- 
azonosítását egy (23, 12) paraméterű Golay-kóddal védik. Ennek a kódnak a kód- 
távolsága 7, ezért 3 hibát tud javítani. Könnyen ellenőrizhető, hogy a kód para- 
métereire a Hamming-korlátban az — teljesül: 


3 /23 cat 
(7) 


tehát ez a kód perfekt. Eredetileg Golay a kódot szisztematikus generátormátrixá- 
val adta meg: 


10000000000011011100010 
01000000000001101110001 
00100000000010110111000 
00010000000001011011100 
00001000000000101101110 
000001000000000101l10111 
00000010000010001011011 
00000001000011000101101 
00000000100011100010110 
0900000000010001110001011 
00000000001010111000101 
O00OO0OOOOOOOOLL I LII I111111 


Kiderült, hogy ez a kód ciklikus is, és a generátorpolinomja 
209) —x ax 451 hat hr 1. 


Ugyanilyen paraméterű kódot kapunk a 





generátorpolinommal. Ezek valóban 23 hosszú ciklikus kódok generátorpolinom- 
jai, ugyanis 

(x— Del) e (x) — 123 — 1. 
Mivel a g(x) együtthatói közül 7 darab 1, ezért a minimális súly nem lehet 7-nél 
nagyobb. Megmutatható, hogy pontosan 7: 
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4.22. tétel. A (23, 12) paraméterű Golay-kód egy 3 hibát javító perfekt, lineáris, 
ciklikus kód. 


Ciklikus kódok shiftregiszteres generálásai 


Mind a ciklikus kódok generálására, mind a paritásellenőrzésre hatékony esz- 
köz a lineárisan előrecsatolt illetve a lineárisan visszacsatolt shiftregiszter. 

Mint láttuk, egy (n,k) paraméterű ciklikus kód nemszisztematikusan generál- 
ható g(x) — g03-g1x- : : "1 gn xx" generátorpolinomja felhasználásával, amely- 


nél egy u(x) — 40 4 u1x- uk -1x7! üzenethez a 


c(x) — u(x)g(x) (4.9) 


polinomszorzással generáljuk a c(x) — cg 4-cixt: tk Cn-1x7! kódszót. A (4.9) 
alakú polinomszorzás a 4.2. ábra szerinti lineárisan előrecsatolt shiftregiszteres 
elrendezéssel realizálható. 

Könnyen látható, hogy ha a zéró kezdő értékű regiszterbe n lépésben belép- 
tetjük a zéróelemekkel n hosszúra kiegészített uo, 1 , . . . , 4k—1, 0, . . . , 0 sorozatot, 
akkor a 4.2. ábra szerinti generátor kimenetén megjelenő karakterek lépésenként 
a következők: 


0. co — Uuogo 
Ci —  uog1i-T 180 
n—-l. Cn-1 — Uk-18n-k, (4.10) 


azaz valóban a (4.9) polinomszorzást hajtjuk végre. 


NN S k 
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4.2. ábra. Nemszisztematikus generálás előrecsatolással. 
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51—1 ző lát 


s] §j—1 e] §j—2 moge. e] 5 j—L 
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4.3. ábra. LFSR. 
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A szisztematikus generálás realizálásának hatékony alapeleme a 4.3. ábra sze- 
rinti lineárisan visszacsatolt shiftregiszter (LFSR, Linear Feedback Shift Regis- 
ter). 

A shiftregiszter L hosszú, és a kezdő érték so, s1 , . . . 5-1. A további, sj, j2L 
elemek a 


L 
SSE fs. Jas (4.11) 
i—1 


rekurzív alakban állnak elő. A (4.11) összefüggést gyakran célszerűbb az 


L 
Ffisj-r—0,  j2ZL (4.12) 
i—0 


alakba átírni, ahol fo — 1. Az LFSR-hez rendelt 


f)—forfnx-r fő r fix (4.13) 


polinomot az LFSR karakterisztikus polinomjának nevezzük. Az (f(x), L) je- 
lölést használjuk az f(x) karakterisztikus polinomú és L regiszterhosszú LFSR 
jelölésére. 

Egy (n,k) paraméterű ciklikus kód egyértelműen megadható h(x) — ho 3-h1x-k 
. .. 4.hxx" paritásellenőrző polinomjával. Vezessük be a h(x) polinom 


h(x) — hi b hkaax- tb hox 


reciprok polinomját. Megmutatjuk, hogy ciklikus kódot szisztematikusan gene- 


a 


rálhatunk (h(x),k) LFSR segítségével, ha a kezdő értéket a kódolandó üzenet- 
nek választjuk. A c(x) — co cix Tt: cne1xT! szisztematikus kódszóban a 
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Cn-1 — Ug, Cn—2 — UI, ..., Cn-k — Uk-1 pozíciókba helyezzük el az üzenetkarak- 
tereket. 
A 4.20. tétel szerint egy lineáris, ciklikus kódra c(x) akkor és csak akkor kód- 
szópolinom, ha 
c(x)h(x)—0 mod(x"—1), (4.14) 


amelynek alapján a c(x)h(x) polinomn—1,n— 2, . . . ,k fokszámú tagjainak együtt- 
hatójára az alábbi összefüggéseket írhatjuk fel: 

















hocn—1-hi1Cn-2 T-t" AkCn-kri — 0 
hocn-2 thicn-3 4: ""thkCn-k-2 — 0 
hocxk14-hick-1t:":"thkco — 0 (4.15) 


Mivel a g(x) generátorpolinom főpolinom, ezért a h(x)g(x) — x" — 1 összefüggés- 
ből következik, hogy Ah(x) is főpolinom, azaz h, — 1. Ennek figyelembevételével 
a (4.15) egyenletek a következő rekurzív alakba írhatók: 


ki 
ÖEKEJZES ) hicCn—i—j, (4.16) 
1—0 
j7-1,2,...,n—k, azaz Cn. 1 — ug, Cn-2 — MI, .. . , Cn-k — Uk-1 iISmMeretében gene- 
ráljuk a Cn. k-1,Cn—k—2), . . . , Co paritásszegmenst. 


A 4.4. ábrán látható a paritásellenőrző polinomra épülő LFSR kódgenerálás, 
melynek megfeleltetése: 


f(x) — h(x); L —k; 50 — U0, S1 — U2, ..., $k—1 — Uk-1. 
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4.4. ábra. Kódgenerálás paritásellenőrző polinommal. 
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4.5. ábra. Osztás g(x) polinommal. 


A paritásellenőrző polinommal történő kódgenerálásnál az LFSR regiszter- 
hossza k karakter. Így ezt az eljárást nem célszerű alkalmazni azon tipikus esetek- 
ben, amikor nagyobb az üzenethossz a paritásszegmens n — k méretéhez képest. 
Ekkor célszerűbb a generátorpolinom alapú shiftregiszteres generálás. Tudjuk, 
hogy egy (n,k) paraméterű g(x) generátorpolinomú ciklikus kód u(x) üzenethez 
tartozó c(x) kódszava szisztematikusan generálható az alábbi összefüggéssel (lásd 
a 4.19. tétel bizonyítása után írtakat): 


c(x) — uxor — [u(x)xT 7 mod g(x). (4.17) 


A (4.17) összefüggésben egy u(x) ax" polinomnak a g(x) polinomra vett maradé- 
kát kell képezni. Figyelembe véve, hogy g(x)-et főpolinomnak választottuk, ezt a 
polinomosztást végzi el az alábbi visszacsatolt shiftregiszteres osztó elrendezés. 

Az osztó elrendezés által végzett shiftelés és az éppen kilépő elemmel az osz- 
tópolinom nemzérus együtthatóinak megfelelő pozíciókban történő súlyozott le- 
vonás nyilván a jól ismert polinomosztás egy lépésének a végrehajtását jelenti. 
Tehát a 4.5. ábrán látható elrendezés euklidészi osztást végez. Zéró kezdő álla- 
potból indítva, és az osztó bemenetére időben egymás után a d, 1,dn-2, . . . , do 
elemeket léptetve a 


d(x) — a(x) 80) a-rW) (4.18) 


euklidészi osztásnak megfelelően a kimenetén a g(x) hányados, a regiszterében 
pedig az r(x) maradék áll elő. Így a bemenetén az n—k 0-ával kiegészített k üze- 
netkaraktert beléptetve, n lépés után a regiszter az [u(x)x"7"] mod g(x) maradékot 
tartalmazza. 

Nyilván az osztó elrendezés használható CRC generálására illetve ellenőrzé- 
sére is, mivel ekkor is egy (n,k) paraméterű szisztematikus ciklikus kód kódsza- 
vait állítjuk elő. CRC generáláskor a fentiekben elmondott módon paritásszeg- 
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menst állítunk elő, míg ellenőrzéskor hibátlan szó esetén zéró osztási maradékot 
kapunk az osztó regiszterében. 


4.9. BCH-kód 


4.26. definíció. Az n kódszóhosszú, n — g" — 1, GF(g) feletti kódott hibát javító 
BCH-kódnak nevezzük, ha a g(x) generátorpolinomjának gyökei az o/ e GF(g"), 
i —- 1,2,... , 2t testelemek. (BCH - Bose-Chaudhuri-Hocguenghem) 


4.23. tétel. Ha az n kódszóhosszú, GF(g) feletti C ciklikus kód generátorpoli- 
nomjának az a ec GF(g") elem d — 1 egymás utáni (különböző) hatványa gyöke, 
azaz valamely ig 2 0,d 5 1 esetén 


g(oio) — g(ariot1) — . . . — g(oriotd—2) — 0, 
akkor a kód minimális távolsága legalább d. 


BIZONYÍTÁS: Amennyiben c(x) C-beli kódszó, akkor c(ci9) — c(orot1 ) — . . . — 
c(oiotd—2) — 0. A paritásellenőrző mátrixot a következő tömör formában írhatjuk 
fel: 


1 ai aZio Bet ar 1) io 
jé 1 aior1 a2(io-1) c a(n—1) (io 1) 
1 oriotd—2  g2(ior-d—2)  ... a(r—1)(io3-a—2) 


hiszen például c(oio) — cg -k cso -p co p ... cp. pol io. Az állítás bizo- 
nyításához azt kell megmutatni, hogy a H mátrix bármely d — 1 vagy kevesebb 
oszlopa GF(g") feletti vektorok lineárisan független halmaza, ekkor ugyanis leg- 
alább d súlyú az a c vektor, amelyre Hc? — 0, és így a kód teljesíti az előírt 
minimális távolságot. 

Az indirekt bizonyításhoz tegyük fel, hogy van egy € vektor, amelynek súlya 
w d —lL, az i € (d1,a2,. . . , w) pozíciókban tartalmazza nemzérus karaktereit 
és Hc! — 0. Ekkor az 


ai io védi Ogwio Cai 
ai (io 1) bdslt ogw(iot-1) 


a21(io-tw—1) ÉS o (iot-w—1) Ca 
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egyenletben a mátrix determinánsa 0. De ezen mátrix determinánsa az ún. Van- 
dermonde-determináns o(aitHüwJio. szorosa: 


1 Hat 1 
a Bő a w-1l1 w 
det j j j — [I [I (orzi — o) 
: fs : j—-1i—j-1 
a (w-1) epe ogw(w-1) 


A Vandermonde-determináns viszont nemzérus, mivel ci 5iz oj, i AZ Jj,ijeE 
(0,1,...,1— 1) esetén, hiszen a rendje n. HI 


Így, ha a, o2,...,o2! a g(x) gyökei, akkor d 5 2t 4-1, tehát a kód t hibát 
képes javítani (ig — 1). Ez támasztja aláa BCH generátorpolinom fentebb mondott 
választását. 

Ha g — 2, akkor bináris BCH-kódot kapunk, míg m — 1 esetben Reed-—Solo- 
mon-kódra jutunk. A tr — 1, g — 2 választással kapjuk a Hamming-kódokat. Mivel 
a GF(g) feletti polinomok között az a c GF(g) testelem az x — a elsőfokú polinom 
gyöke, így a t hibát javító Reed-Solomon-kód generátorpolinomja lehet például a 

809—(—1D(x—9)(x— 02) e (x— ot) 


polinom (ig — 0), ahol c rendje n. 


A g(x) generátorpolinom konstrukciója 


Mint láttuk, egy n kódszóhosszú GH(g) feletti lineáris ciklikus kód g(x) ge- 
nerátorpolinomja az x" — 1 polinom osztója. Az állítás megfordítása is igaz: az 
x" — 1 polinom tetszőleges — nemtriviális — GF(g) feletti osztója egy C(n,k), 
deg(g(x)) — n—k paraméterű GF(g) feletti lineáris ciklikus kód generátorpo- 
linomja lehet. A linearitás nyilvánvaló, hiszen a(x)g(x) -- b(x)g(x) — (a(x) 4 
b(x))g(x). A ciklikussághoz elég azt belátni, hogy egy ciklikus léptetés is kód- 
szóra vezet. Ehhez tekintsük a következő két esetet: deg(a(x)) c k—1 illetve 
deg(a(x)) — k— 1. Az első eset egyszerű, mivel deg(xa(x)g(x)) c n. A második 
esetben az igazolás 





xa(x)g(x) — ar 1(x"—1) 4 r(x) 
maradékos osztás egyenlőségen alapul, ahol azt kell belátni az r(x) maradékra, 
hogy r(x) — a" (x)e(x) alakú valamely a"(x) polinomra. Ez azonban egyszerűen 
következik a g(x) ] x" — 1 feltétel felhasználásával. 
A g(x) generátorpolinomot tehát az x" — 1 polinom GF(g) feletti irreducíbilis 
faktorjaiból konstruáljuk, ahol legyen 


x—-1— fi(xy f(x): f(x) (4.19) 
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a GE(g) feletti irreducíbilis faktorokra bontás. Ennek alapján az s különböző 
faktor összes lehetséges nemtriviális kombinációjával 2" — 2 különböző generá- 
torpolinom — és hozzájuk tartozó n kódszóhosszú GE(g) feletti ciklikus kód — 
állítható elő. 

Tekintsük az n — g"— 1 kódszóhosszakat, azaz úgynevezett primitív szóhosz- 
szú kódokat konstruálunk. A konstrukcióval kapcsolatos GF(g) testet szokás az 
együtthatók testének (, kis testnek"), míg a GF(g"") testet a gyökök testének (, nagy 
testnek") nevezni. A testelméleti alapokból ismeretes, hogy tetszőleges GF(0) 
test esetén 


x2-t 1—[[(x—B;), (4.20) 


J 


ahol a B; gyökök a GF(O) test különböző nemzérus elemei. A (4.19), (4.20) for- 
mulák alapján a primitív szóhosszú kódok esetén a B; testelemek mindegyike egy 
és csak egy f;(x) faktor gyöke. Innen már az is látható, hogy ha a B; testelem az 
f(x) gyöke, akkor f(x) irreducíbilis polinom egyben minimális fokszámú GH(g) 
feletti polinom ezen tulajdonsággal. Ha feltesszük ugyanis, hogy nem f;(x), ha- 
nem egy tőle különböző k(x) GF(g) feletti polinom lenne minimális fokszámú po- 
linom nevezett tulajdonsággal, az ellentmondásra vezetne. Ezt a szokásos trükkel 
igazolhatjuk: az f;(x) — g(x)k(x) 4 r(x) maradékos osztás egyenlőségbe helyet- 
tesítsük a Bj gyököt, s vegyük figyelembe, hogy deg(r(x)) c deg(k(x)) valamint 
azt, hogy fi(x) irreducíbilis. Az f;(x) polinomot a B; GF(g")-beli testelem GH(g) 
feletti minimálpolinomjának nevezzük. 


4.12. példa. Legkisebb példaként tekintsük a g— 2,m — 2 esetet (azaz GF(2) a kis 
test, GF(4) a nagy test). Ekkor a (4.19), (4.20) formuláknak megfelelő felbontások 
a következő egyszerű alakot öltik: 





5—17- fik)20)—-6—DEÉ tr 1) —(x—D((x—09(x— 00), 


ahol a a GF(4) primitív eleme. Az 1 ec GF(4) egységelem GEF(2) feletti mini- 
málpolinomja nyilván fi(x) — x— 1, míg az és a? GF(4) testelemek közös GF(2) 
feletti minimálpolinomja f1(x) — x23xil. 


Visszatekintve a BCH-kód 4.26. definíciójára, az eddigiek alapján láthatjuk, 
hogy t hibát javító BCH-kód generátorpolinomját úgy konstruálhatjuk meg, hogy 
megkeressük az al e GE(g") gyökök különböző, GF(g) feletti minimálpolinom- 
jait, s azokat összeszorozzuk. 

Ezek után már , csak" egy tisztán algebrai technikai kérdésről van szó, arról, 
hogy hogyan konstruáljunk minimálpolinomot. Az alábbiakban röviden megmu- 
tatjuk a technikát (részletesebben lásd például [10] 5.3. fejezet). 
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Ha egy f(x) polinom egy B GF(g")-beli testelem GF(g) feletti minimálpoli- 
nomja, akkor f(x) gyökhalmaza a B elem úgynevezett konjugáltjainak 


(B.B..B7,....B7) 


halmaza, amely halmaz elemeit B egymás után, g-adik hatványra emelésével ké- 
pezzük a GH(g") testben, továbbá ahol v az a legkisebb hatványkitevő, amelyre 


B" B. 


Mindezek alapján gyöktényezős (nagy test feletti linearizált) alakban meg tud- 
juk már adni a minimálpolinomokat. Ebből az alakból az explicit alakú polinomo- 
kat a lineáris faktorok összeszorzásával kapjuk a nagy testbeli aritmetika szerint, 
amelynek során az együtthatók végülis kis testbeli együtthatókká egyszerűsödnek. 

A 4.12. példa esetén a. konjugáltjainak halmaza kételemű, tagjai Ot és o? (a? — 
0). 

Az eddigiek alapján anélkül, hogy megkonstruálnánk magát a generátorpo- 
linomot, azt már meg tudjuk mondani, hogy mekkora lesz a generátorpolinom 
fokszáma, következésképp hogy mekkora a kód k paramétere illetve R — k kódse- 
bessége. Ehhez nem kell mást tennünk, mint konjugált halmazokra bontani a nagy 
test nemzérus elemeinek g" — 1 méretű halmazát. Mivel a nemzérus testelemek a 
primitív elem hatványaiként megkaphatók, a konjugált halmazok meghatározásá- 


24 


nál elegendő a halmaz elemei helyett a megfelelő primitív elem kitevőjét megadni. 
4.13. példa. GF(16), g — 2,m — 4: 


104 
(1,2,4,81 
13,6,12,9) 
15,10) 
£f7,14,13,11) 
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ahol — primitív elem kitevőiről lévén szó — modulo 15 számolunk. Ennek alap- 
ján például egy t — 1 paraméterű kód generátorpolinomjához tartozó konjugált 
(kitevő) halmaz (1,2,4,8), azaz C(15,11) a kapcsolatos bináris Hamming-kód 
paramétere. Hasonlóan, ha egy n — 15 kódszóhosszú t — 2 hibát javító bináris 
BCH-kódot szeretnénk generálni, akkor (1,2,4,8) és 13,6, 12,9) kitevőhalma- 
zoknak megfelelő gyökök szerepelnek a generátorpolinomban, tehát a kód sebes- 
sége R — 1 7 0.466 lesz. 


A BCH kódok előállíthatók mint a Reed-Solomon kódok részkódjai. Ehhez 
kapcsolódik az alábbi tétel: 
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4.24. tétel. Legyen C a GH(g") felett egy (n,k) paraméterű, dmin kódtávolságú 
Reed-Solomon-kód. Legyen C" a C-nek egy részhalmaza, mely C azon kódszava- 
iból áll, melyek koordinátái GF(g)-beliek. C" egy GF(g) feletti (n,k") paraméterű, 
dnin kódtávolságú, lineáris kód, melyre 


kak 


tást 2 dmin- 

A 4.24. tétel bizonyítását az olvasóra bízzuk. A linearitás triviális, másrészt 
C"-ben nyilván nincs több lineárisan független kódszó, mint C-ben, harmadrészt 
egy részkód kódtávolsága nem lehet kisebb, mint az eredeti kódé. A kapott rész- 
kód 4.26. definíció szerinti BCH-kód t 2 (n — k)/2 paraméterrel. 


4.10.  Kódkombinációk 


A standard kódkonstrukciók során kapott kódok paraméterei nem mindig illesz- 
kednek közvetlenül az adott alkalmazásban megkövetelt értékekhez. Hatékony, 
ugyanakkor egyszerű módszerek léteznek arra, hogy változtassuk a kódszóhossz, 
üzenethossz, kódtávolság paraméterek értékét az eredeti konstrukcióhoz képest. 
Az alábbiakban ezen módszereket tekintjük át röviden. 


Kódátfűzés és a csomós hibák javítása 


Adott C(n,k) kód m-szeres átfűzésével egy C" — C(mn,mk) kódot kapunk, 
olyan módon, hogy a C kód el, i — 1,...,m m darab kódszavát egy m x n di- 
menziós mátrixba rendezzük soronként, s a C" átfűzéses kód c kódszavát ezen 
mátrix oszlapainak sorrendben való kiolvasásával képezzük. Azaz a kódszavakat 


4 


(komponens szavakat) fésű módon egymásba toljuk: 


ös KEZE SZGEEGNÉT 7 EL ela ESNEK ZENE DSE A] (4.21) 

Lineáris kódot átfűzve nyilván lineáris kódot kapunk. Az is könnyen látható, 
hogy ha d a C kód kódtávolsága, akkor a C" átfűzéses kód távolsága is d ma- 
rad. Lineáris C kódot tekintve legyen c(), i — 1, . . . n sorozat egyik kódszavának 
súlya d, míg a többi kódszó legyen a zérus kódszó. Általános esetben tekintsük 
C kódbeli kódszavak e(!, i — 1,...,m, e2), i — 1,...,m két sorozatát, ahol 
c) és e2) távolsága d, míg ell) — el), i — 2,...,m. (A CD példájában 
m — 2,n — 28 ,k — 24.) 
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Ciklikus kódot átfűzve ciklikus kódot kapunk. Legyen § az egyszeri ciklikus 
jobbra léptetés operátora. Könnyen ellenőrizhető, hogy a (4.21) szerinti c kódszó 
Sc ciklikus eltolása az Sc(" , e(D e2, . . . elm) sorozat átfűzésének felel meg, s 
mivel Sc(") e C, ezért Sc € C" is fennáll. A C és a C" kódok generátorpolinomja 
között egyszerű kapcsolat áll fenn: 


4.25. tétel. Ha g(x) a C kód generátorpolinomja, akkor g(x") a C" kód generá- 
torpolinomja. 


BIZONYÍTÁS: Mivel g(x) — mint generátorpolinom — a C kód egyben leg- 
kisebb fokszámú nemzérus főpolinom kódszava, ezért a c (x) — g(x), c (x) — 


0, ... cí (x) — 0 sorozat átfűzésével kapható kódszó polinom alakban g(x"), a 
C" kód legkisebb fokszámú nemzérus főpolinom kódszava, azaz generátorpoli- 
nomja. HI 


Mint láttuk, a kódtávolság nem változik átfűzés során, ami azt jelenti, hogy a 
C" átfűzéses kód szokásos képességei (véletlen hibák javítása, törlésjavítás, de- 
tekciós képesség) romlanak az átfűzéssel, hiszen ezen képességek m-szeres kód- 
szóhosszon érvényesek. Ha valaki itt arra gondolna, hogy például az egyes kom- 
ponensszavak javítóképessége nem változott, s így a teljes javító képesség a kom- 
ponensek m-szeresének tűnik, az ott hibázik, hogy t javítóképesség azt jelenti, 
hogy tetszőleges t pozícióban eshet hiba, nem pedig azt, hogy az a komponens 
szavaknak megfelelően kerül , szétosztásra". Ezen a ponton felmerül a természe- 
tes kérdés: egyáltalán mire jó akkor az átfűzés? A válasz: hibacsomók javítására. 

A hibavektor egy / hosszúságú szegmense hibacsomó ! hosszal, ha a szeg- 
mens első és utolsó karaktere nem zérus. Egy kód /! hosszúságú hibacsomót javító, 
ha minden legfeljebb / hosszúságú hibacsomó javítható. 


4.26. tétel. A C" átfűzéses kód m-t hosszúságú hibacsomót javító, aholt aC kód 
javítóképessége. 


BIZONYÍTÁS: A (4.21) szerinti c kódszóban egy legfeljebb m - t hosszúságú hi- 
bacsomónak megfelelő hibázás a komponens szavakban legfeljebb t számú hibát 
okozhat, amit azok javítani képesek. (A t — 2 esetet szemlélteti a 4.6. ábra.) I 


Egy tetszőleges lineáris C(n,k) kód n,k paramétere alapján a kód /! hibacso- 
mójavító képességére az alábbi egyszerű korlát adható: 


4.27. tétel. Egy C(n,k) lineáris kód I! hibacsomójavító képességére fennáll, hogy 
ESTE k 


232 4. HIBAJAVÍTÓ KÓDOLÁS 





1. kódszó 








2. kódszó 
































m. kódszó 























4.6. ábra. Kódátfűzés t — 2 esetén. 


BIZONYÍTÁS: Tekintsünk egy tetszőleges nemzérus kódszót, s abban a leghosz- 
szabb, nemzérussal kezdődő, s nemzérussal végződő részsorozatot (a továbbiak- 
ban csomórészsorozat). Tegyük fel, hogy az összes nemzérus kódszót tekintve a 
legrövidebb ilyen részsorozat hossza b 3-1. Ekkor egy adott kódszópozícióban 
kezdődő, legfeljebb b hosszú hibacsomóknak megfelelő hibavektorok a standard 
elrendezési táblázatban különböző sorokba (mellékosztályokba) kell, hogy esse- 
nek, ellenkező esetben két ilyen hibavektor különbsége kódszó lenne, ami ellent- 
mondásra vezetne. Mivel a táblázat sorainak száma g"7", továbbá a különböző 
legfeljebb b hosszú hibacsomók száma G?, ezért g? £ g77", ahonnan b £n-k 
adódik. Tehát van olyan kódszó, amelyben a leghosszabb csomórészsorozat hosz- 
sza legfeljebb n — k -- 1. Ha ezen kódszó ezen csomórészsorozatát szétvágjuk két 
rövidebb csomórészsorozatra, akkor az azoknak megfelelő hibavektorok azonos 
mellékosztályba kell, hogy essenek, hiszen ezen vektorok összege kódszó, követ- 
kezésképpen csak egyikük választható mellékosztály-vezetőnek, vagyis javítható 
hibamintának. Innen már következik, hogy garantálhatóan legfeljebb az Lt] 
hosszú hibacsomók javíthatók. 1. 


A tételbeli korlát Reiger-korlát néven ismert. Azokat a hibacsomó javító kó- 
dokat, amelyre / — Lt] fennáll, Reiger-optimálisnak hívjuk. 


MEGJEGYZÉS: Egy MDS tulajdonságú lineáris kód Reiger-optimális. 


4.14. példa. A g(x) — (x--1)(xx-1) — xx? hx? --1 generátorpolinomú 
C(7,3,4), GF(2) kód hibacsomójavító képessége / — 2, azaz Reiger-optimális. 
Ennek egy praktikus ellenőrzési módja az, hogy megmutatjuk, hogy az xi, i — 
0,..., 6 ésxi-Bxit!, i — 0, . . . , 5 polinomok osztási maradékai különbözőek a g(x) 
generátorpolinomra. 
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4.7. ábra. A szorzat-kódszó képzése. 


Szorzatkód 


Egy C1(m,ki,d1) és egy C2(m,k2,d2) lineáris kód (komponenskódok) fel- 
használásával Ci x C2(ni :n2 , ki : ka , di " d ) szorzatkódot készíthetünk, amelynek 
kódszavai ni x n; dimenziós mátrixok, ahol a mátrix sorai Ci kódbeli, oszlopai 
C; kódbeli kódszavak. Szisztematikus komponenskódok esetén a szorzatkódbeli 
mátrix-kódszó bal felső ki x ka dimenziós minorja tartalmazza az üzenetet. A 
mátrix-kódszavakat soronként kiolvasva kapjuk a szorzatkód — soros — kódsza- 
vát. A kapott Ci x C2 (mi : n2 ,ki : ka) kód lineáris. 

A mátrix-kódszó képzése a következőképp történik. Az első ki oszlopot a 
C2(n2,k2) kód alapján szisztematikus kódolással kapjuk, kiegészítve a ka hosszú 
üzenetszegmenst n, — ka hosszú paritásszegmenssel (4.7. ábra). Az első ka sort a 
C1(n1,ki1) kód alapján szisztematikus kódolással kapjuk, kiegészítve a ks hosszú 
üzenetszegmenst ni — ki hosszú paritásszegmenssel. A mátrix jobb alsó sarkába 
kerül a paritások paritása, amit — mint azt hamarosan belátjuk — képezhetjük 
akár az első ki oszlop, akár az első ka sor paritásai alapján szisztematikus kódo- 
lással a C5 illetve Ci kódbeli szavakkal. A fenti módon képezett szorzatkódot — 
amelynek sorai illetve oszlopai az alapkódok kódszavai — kanonikus elrendezé- 
sűnek nevezzük. 

A paritások paritásai képzésével kapcsolatos alábbi gondolatmenetünket il- 
lusztrálja a 4.8. ábra. 

Képezzük azt a Ci x Cs kódbeli kódszót, amelynek üzenetmátrixa csak az 
(i1, Ji ) koordinátájú helyen tartalmaz nullától különböző elemet. Ehhez az üzenet- 
hez képezzük a C5 illetve Ci kódolás szerint a Ci x C2 kódbeli kódszó i1-edik so- 
rát és j1-edik oszlopát. A kétdimenziós paritásszegmens jobb felső illetve bal alsó 
részmátrixa az i1-edik sor illetve a j1-edik oszlop kivételével csak 0 elemeket tar- 
talmaz. Innen már egyszerűen látszik, hogy a jobb alsó részmátrixot megkaphat- 
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Ji ja — J3 Ja 
4.8. ábra. A paritások paritásainak képzése. 


juk, akár az (ia, j1) illetve (iz, j1) elemekből C2 kód szerinti, akár (ii, j2), (ir, J3) 
illetve (ii, ja) elemekből Ci kód szerinti kódolással. S miután a Ci x C2 kód line- 
áris, ezért tetszőleges üzenetmátrixú szorzatkód kódszót a 4.8. ábrán is illusztrált 
elem-kódszavakból koordinátánként vett összeadással képezhetjük. 

Annak igazolása, hogy a szorzatkód kódtávolsága a komponens kódok távol- 
ságainak szorzata, a minimális nemzérus súlyú, azaz d1 : d2 súlyú kódszó előállí- 
tásával történhet. Válasszunk ehhez egy-egy minimális súlyú kódszót a C! illetve 
C; kódból, amelyeket jelöljön c" illetve c", ekkor egy minimális súlyú mátrix- 
kódszó az i-edik sorában a c" kódszót tartalmazza, ha c" i-edik komponense 1, 
egyébként a csupa zérus kódszó kerül a sorba. Az, hogy a kapott kódszó minimá- 
lis súlyú, onnan látható, hogy ha nem minimális súlyú c" kódszót helyeznénk el 
valamelyik sorba, akkor több nemzérus oszlopot kellene elhelyezni a mátrixban a 
Ci kódszavai közül és viszont. 


4.15. példa. Az egyik legismertebb és egyben legegyszerűbb konstrukciójú hiba- 
javító kód a kétdimenziós paritáskód. Ez egy C x C szorzatkód, ahol a C kom- 
ponenskód (n,n — 1,2) paraméterű egy paritásbittel rendelkező, egy hibát jelző 
bináris kód. A kapott szorzatkód kódtávolsága 4, azaz egyszerű paritásbites konst- 
rukcióval 1 hiba javítására vagy 3 hiba jelzésére alkalmas kódot kaptunk. 


A mátrix-kódszóban a komponens kódszavak eredeti elrendezése a kanoni- 
kus elrendezés. Ha a C1,C2 komponenskódok ciklikusak, akkor egy másfajta 
mátrixbeli elrendezéssel, az úgynevezett ciklikus elrendezéssel elérhetjük, hogy 
a soronkénti kiolvasással kapott kódszó ciklikus legyen. Ha a C1(ni,ki,d1) és 
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C2 Ci Ci C2 
adat :] külső belső ].: :] belső külső ]:; adat 
be  "Lkódoló ] "] kódoló [17] Salorna [vrdekódoló] " [dekódoló 7 "ki 
— kóddó dekódoló 7 


4.9. ábra. Kaszkád kódoló. 


C2 (n2 , ka , 2) komponenskódok ni és n2 szóhosszai relatív prímek, akkor a kano- 
nikus mátrixbeli pozíciókat úgy rendezzük át, hogy az ni x n2 dimenziós mátrix 
(u,v), 0 £ u c ny, 0 £ v Ca n2 koordinátájú eleme az (w ,v),0 Cu cm, 0 Lv! c na 
pozícióba kerüljön, ahol u! — u -n2 tv mod ni, v — u-n--v mod n2. A pozí- 
ciók ezen megfeleltetése a kínai maradéktétel (lásd a következő fejezetben) miatt 
egyértelmű a relatív prím szóhosszak esetén. 


Kaszkád kódok 


Vegyünk egy C1(ni,ki,d1) GF(g) feletti és egy C2(N2, K2,D2) GF(g") fe- 
letti lineáris kódot, amelyből az alábbi módon generálhatjuk a szisztematikus, 
C(niN2 , ki Ka , d) paraméterű GF(g) feletti kaszkád kód kódszavait. A k1K2 hosz- 
szú üzenetet osszuk fel K2, egyenként ki hosszú szegmensre. A C? kód egy ki 
hosszú üzenetszegmenst egy üzenetkarakternek vesz, és K? ilyen karakter alkot 
számára egy üzenetszegmenst, amelyből N2 karakter hosszúságú kódszót képez 
N2 — K; paritáskarakternek az üzenethez való illesztésével. A C2-beli kódszó el- 
készülte után a kódszó mindegyik koordinátáját a Ci kód kódolója újra ki hosz- 
szúságú üzenetként értelmezi, és ni — ki paritáskarakterrel kiegészíti. Így kapjuk 
az ni N2 hosszú kódszót, ami a kaszkád kód adott k1.K2 hosszú üzenethez tartozó 
kódszava. A kaszkád kód kódtávolsága d 2 d1D2. 

A Ci kódot belső, a C; kódot külső kódnak is nevezik. A kód az elneve- 
zését onnan kapta, hogy a külső kód kódolójának és a belső kód kódolójának a 
kaszkádba kötése képezi a generált kód kódolóját (4.9. ábra). 

A dekódolás során először a Ci kódszavakat dekódoljuk, majd értelemsze- 
rűen, a Ci kódszavai paritásszegmensének törlése után a C2 kódszó dekódolását 
végezzük el. 

A kaszkád kódok igen alkalmasak az együttes csomós és véletlen hibák javí- 
tására, ahol a csomós hibákat a C; kód, a véletlen hibákat a Ci kód javítja első- 
sorban. A C; kód egy karakterének tetszőleges meghibásodása legfeljebb ki mé- 
retű g-áris hibaszámnak felel meg. Ugyanakkor ritka egyedi hibák javítása C1-beli 
kódszavakban könnyen elvégezhető, míg ezen egyedi hibák C2-beli karakterszintű 


javítása , pazarlás" lenne. 
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4.11.  Kódmódosítások 


Rövidített kód 


Egy C(n,k) kód rövidítésével egy C(n—i,k—i), 1 C i c k kódot kapunk olyan 
módon, hogy a C(n,k) szisztematikus kód kódszavai közül csak azokat hagyjuk 
meg, amelyek az első i karakterén zérust tartalmazó üzenetekhez rendeltek. Ek- 
kor a C(n,k) kód i karakterrel történő rövidítéséről beszélünk. Mivel a rövidített 
kód kódszavai a C(n,k) kód kódszavai is egyben, ezért a rövidített kód minimális 
távolsága legalább akkora, mint az eredeti kódé volt. Praktikusan természetesen 
a kódoló és a dekódoló úgy van kiképezve, hogy az első i zérus karaktert nem is 
továbbítjuk, s a dekóder zérusnak tekinti azokat. A kódrövidítés elsődleges célja 
a kódhossznak az alkalmazásbeli paraméterekhez való igazítása. 


2 9 


Paritásbittel bővítés 


A paritáskarakterrel történő kiegészítés után a C(n,k) bináris lineáris alap- 
kódból egy c (n7-1,k) lineáris kódot kapunk, amelynek a minimális távolsága 
az alapkód d minimális távolságával azonos, ha d páros, illetve d -- 1 lesz, ha d 
páratlan. A HZ paritásmátrix Hc ismeretében az alábbi alakú: 


bg d ese 
0 

Hz — Hc ; (4.22) 
0 
0 


4.16. példa. Adjuk meg a C(7,4) Hamming-kód C(8, 4) paritásbittel bővített kód- 
jának paritásmátrixát. Az x? 4 x-k 1 generátorpolinomú Hamming-kód bővítésé- 
vel a (4.22) képlet alapján 


(86 HG IE (EE ÉR 1ÉG HAS 
fás ze OS d 001 420 
€— [01-01-11 00 

1 ÖÖ dr Öt ár Ő 


A kapott C (8,4) kód nyilván nem ciklikus, például a (10001101) a C kódszava, 
de (11000110) már nem az. A bővített kód minimális távolsága 4, ezért 3 véletlen 
hiba detektálására alkalmas. 
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4.12.  Reed-Solomon-kódok dekódolása 


Tekintsünk egy (n,k) paraméterű GF(g) feletti lineáris kódot. Egy c kódszó kül- 
désekor és v szó vételekor az e — v — c hibavektorra és s szindrómára 


s" — Hv" — H(c-4-e)" —Hc" 3 He" — HeT 


teljesül. 

Ezen egyenlőség alapján az n hosszú e hibavektor rekonstrukciójához az n—k 
hosszú s szindróma áll rendelkezésre. A vett szóhoz legközelebbi kódszóba javí- 
táskor egy lineáris egyenletrendszer egy speciális tulajdonságú, mégpedig a leg- 
kisebb súlyú megoldását keressük. A minimális súlyú e — (eg, e1, . . . , n-1) hiba- 
vektor rekonstrukciójához a következő ismeretlenek felderítésére van szükség: 


e a hibák száma: t, 
e ahibák helye: 0 Cizj Ci C::: Cip Cn—l, 


e a hibák értéke: e; , e; , . . . , ez, . 
Ha csak törléses hibánk van, akkor ismerjük a hibák számát és a hibahelye- 
ket, csupán a hibaértékeket kell megtalálni. A Reed-Solomon-kódok 4.1. és 4.2. 
konstrukciója kapcsán éppen a törléses hibák lehetséges maximális számának ki- 
derítésével bizonyítottuk, hogy a Reed-Solomon-kód maximális távolságú. Ezt 
úgy tettük, hogy az 
uG— c 


egyenletrendszer azon részrendszerét tudtuk megoldani, amely a nem törölt po- 
zíciók halmazának felelt meg. Ilymódon persze közvetlenül az u üzenetvektort 
kaptuk meg. Annak érdekében, hogy az általános hibajavítási feladat harmadik 
komponensére adott megoldás alapelvét megértsük, vizsgáljuk meg a törléses hi- 
bák javítását, mégpedig a hibaértékek megállapítását a Reed-Solomon-kódok 4.3. 
konstrukciójakor, amikor a kódot a 


Hc" —0 


paritásegyenlet megoldásainak a halmaza adta, ahol 


1 a oz o! 

6 al a2(n-1) 
H — . 

1 ork a2(n-k) a(n—k)(n—1) 
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A vett szó törléses pozícióiba írjunk 0-t, és az így kapott v szó esetén számítsuk 
ki az s7 — Hv! szindrómát. Ekkor az e hibavektort az 


s" — HeT 
egyenlet megoldása adja. Vezessük be a következő jelöléseket: 
S— (S1,52,...,5n—k) 
XI — ojj 
Yj — E; ; 


(jJ—1,2,...,t). X-t a j-edik hibahely lokátorának nevezzük, mert a szerinti 
logaritmusa a hibahely. Az s" — He" egyenletrendszer /-edik egyenlete 


n—1 t 
Fero! — ) ejjol ij — sz, 1—-1,2,...,n—k, 
1—0 j—I1 
vagy az új jelöléseinkkel 
£ 
NYXI—s,  — 1—-1,2,....n—k. 
j—I1 


Tudjuk, hogy H minden (n— k) x (n — k) méretű négyzetes részmátrixa invertál- 
ható (lásd a 4.15. tétel utáni megjegyzést), sőt t I n —k esetén annak , bal felső" 
t x t-es részmátrixa is invertálható, tehát t £ n—k esetén az egyenletrendszerünk- 
nek egyértelmű megoldása van, amennyiben X , X2 , . . . , Xz különbözők. 


4.7. lemma. Legyen 


XI Xs KG 
X2 xg2 ... x 

A, sz B s ; , 
XI xX5 BEK XI 


S, — (51, 52, . . . 51) és Y, — (F1, 2, . . . ,Y,). Ha X, X , . . . , X, mind különbözőek, és 
t a n— k, akkor A, invertálható, azaz az 


A,YT —SsI 


egyenletnek van egyértelmű megoldása. Ha XI , X. , . . . , X, nem mind különbözőek, 
akkor A, nem invertálható. 
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2 


BIZONYÍTÁS: A lemma első felét az előzőekben igazoltuk. A második fele azért 
igaz, mert ekkor az A;-nek van legalább két egyforma oszlopa. ha 


Tekintsük ezek után az általános hibajavítási feladatot! Ekkor is ugyanabból 
az egyenletből indulunk ki: 


€ 
NYXI—s, 1—1,2,....n—k. 
j—1 


Most az ismeretlenek: 


e (, 
e X1,X2,. ..,Xp 
e Yi Yes és Í 


tehát egy 2£ -- 1 ismeretlent tartalmazó, n — k egyenletből álló, nemlineáris egyen- 
lettel van dolgunk. Ennek a megoldása elsőre nem tűnik egyszerű feladatnak. 
Megmutatjuk, hogy ez visszavezethető két lineáris egyenletrendszer megoldására, 
melyek közül a másodikat a csak törléses hiba kapcsán az előbb már megismertük. 
Az első egyenletrendszernek kell produkálnia £-t és a hibahelyeket. 

Vezessük be a hibahelypolinomot: 


ki 


L(x) — (1—xX;), 


i—1 


melynek együtthatói 1, L1 , . . . , L., azaz L(x) — 13-L1x- :-: 4L,x. L(x)-et azért 
nevezzük hibahelypolinomnak, mert a gyökei a hibalokátorok inverzei: XI 45 
X5I,... Xr!. Ha megtaláltuk az L(x) polinomot, akkor annak t darab gyöke 
is meghatározható (például az összes nem 0 elem behelyettesítésével), majd azok 
inverzei adják a hibalokátorokat. 

Mivel X Fal az L(x) gyöke, ezért minden /-re és j-re 


[ —1 
Y-XVL(X5") —0, 


tehát 
t 
BEREK) 50; 
j—-1 
azaz 


D1- 


Y; Ég KÜ Mg L.XÍ) — 0, 


s. 
II 
pt 
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tehát 


t t t t 
KAYA HAD DAY e YXJ0, 
—-1 j-1 j—1 j— 


7 éz 


j 
így 
L15141—1 4 L25131—2 tt LSI — —S1 41 


(4 —1,...,t). Ha bevezetjük az 


S1 52 St 
52 53 Sr-3-1 

U, z § , 
St 0 Stral ":"" §21—1 


L, - (I. L.—1, . . B 11), 


V, 7 (—S.41 ) —St42y st —s21) 


jelöléseket, akkor a következő lineáris egyenletrendszerre jutunk: 
ULT EV. 
4.8. lemma. U. invertálható, ha r — t. U, nem invertálható, ha r - t. 


BIZONYÍTÁS: Vezessünk be két mátrixot: az egyik a Vandermonde-mátrix B; j — 
X 12. elemekkel 


1  ssz: d 
B. zza Ü. xi si , 
xr-! xr-1 ÉL . xr-1 
Tr 


ahol r : t esetén X, — 0. A másik egy diagonálmátrix D;j — Y.X;Ö; j elemekkel 


YI XI 0. --- 0 
0 allo 22 eRSESE ÉT 1) 

D, — a ; j ő , 
ÜL JÖ set át 


ahol ő; j a Kronecker-szimbólum. Akkor B,D,BI elemei 


r r : 
(B.D.BD)j — FX YNXxönKx[7" — 
i k-1l 


i—1 
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F . 
— EX MXIX - 
1-1 


es y Y; xit j— 
1-1 
—  §i4j—1— 
— (Uj; 
tehát 
B.D.B7 — U,, 
ezért 


det(B,.) det (D,.) det (Bf) — det(U,). 


Ha r 5 t, akkor det(D,.) — 0, ezért det(U,) — 0. Ha r — t, akkor det(D,.) -— 0, 
másrészt det (B,) — 0 a 4.7. lemma miatt, ugyanis XI , X? , . . . , X; különbözők, és 
det (A,) — det(B,) : Xi : X : . . . " X,. Ekkor viszont det (U,.) - 0, tehát U, invertál- 
ható. HI 


4.28. tétel (Peterson-Gorenstein-Zierler-dekódoló). Ha a Reed-Solomon-kó- 
dok 4.3. konstrukciója esetén a hibák t számára t C Es akkor a következő 
algoritmus helyesen dekódol: 


1. Számítsuk ki az s1, 52, . . . , S n-k szindrómákat! 
2. Keressük meg azt a legnagyobb r-et, melyre U,. invertálható! Ez lesz a t. 


3. Oldjuk meg az 
ULT — v?T 


egyenletet! 


4. Keressük meg az L, által definiált L(x) hibahelypolinom gyökeit, majd azok 
inverzelit: XI, X2 , . . . , X. 


5. Oldjuk meg az 
AT -Ss 


egyenletet! 
6. Számítsuk ki a hibahelyeket: 
ij — logX; 


és a hibaértékeket: 
ej, — Yj, E EAN VARASERSÁAES 8 


8 I 
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A 4.28. tétellel nem azt akarjuk mondani, hogy nagy t esetén így kell dekó- 
dolni. Nagy £ esetén nem ajánlatos a két mátrixinverziót végrehajtani. Ezek he- 
lyettesíthetők hatékonyabb eljárásokkal. Az első helyettesítésére (2. és 3. lépés) 
példa a Berlekxamp-—-Massey-algoritmus, míg a másodikéra (5. lépés) a Forney- 
algoritmus (lásd [10]). 

Kis t-re viszont a Peterson-Gorenstein—-Zierler-dekódoló nemcsak egy elvi, 
hanem egy gyakorlati eljárás is. Nézzük végig illusztrációként a 2 hibát javító 
(n,n — 4) paraméterű Reed-Solomon-kód esetét, amelynek digitális hangtechni- 
kai alkalmazását a 4.6. szakaszban említettük. 


1. Számítsuk ki az s1, 52, 53, 54 szindrómákat! 


2. Ha mind 0, akkor t — 0, és készen vagyunk. Mivel ez a kód 2 hibát tud 
javítani ezért t C 2. Ha det(U2 ) - 0, akkor t — 2. Megjegyezzük, hogy 


det (U2) z det E 5) —- §153 — 53. 
52 §3 


Ha det(U2 ) — 0, akkor det(U1) - 0, mivel feltételünk miatt t legfeljebb 2, 
de sem nem 0, sem nem 2, tehát t — 1. (Ha det (U1) — s1 — 0, akkor ez azt 
jelenti, hogy feltételünk nem teljesül, azaz 2-nél több hiba volt.) 


t—l1 eset: 


3. Oldjuk meg az 
siL1 7 —S2 


egyenletet: L1 — —s2 ST 


4. Keressük meg az L(x)— 1— 52 - st x hibahelypolinom gyökének inverzét: 
XI — 52: s 


5. Oldjuk meg az 


Y1XI 7-7 §1 
egyenletet: Y] — s1iXT s SS: 
6. Számítsuk ki a hibahelyet 
is —logXi 
és a hibaértéket 
ej, — Y. 


t —2 eset: 
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E 


egyenletet! Ezt megtehetjük például a Cramer-szabállyal: 


2] 
L2, — det 64 1) : det É 40 — (5254 — 53) (5153 — 53)! 


S4 §3 52 §3 


3. Oldjuk meg az 


—-1 
S —§ S S e 
Li — det ( 7 ) : det ( ! 8 7 (5253 — $154) (5153 — 53) 1 
52 —S4 53 


52 


4. Keressük meg az L(x) — 1--L1x 4 L2x? hibahelypolinom két gyökét, majd 
azok inverzeit: XI, X2. 


5. Oldjuk meg az 
Y1X1 1-Y2X2 — si 


Y1XI-Y2XI — 52 





egyenletet! (Itt ismét a Cramer-szabály egy lehetséges módszer.) 
6. Számítsuk ki a hibahelyeket 
is — logXI, iz - logX2 
és a hibaértékeket 


Ejj SET Ej - Y. 


4.13. .  Reed-Solomon-kódok spektrális 
tulajdonságai 


Legyen GH(g)-GH(P"), ahol p prím. Bevezetve a [GF(g)]" jelölést a GF(g) (g — 
Pp", p prím) feletti n hosszúságú vektorok halmazára, ahol n ] g — 1, definiáljuk a 
[GF(a)]" halmaz önmagára történő leképezését az alábbi módon: 


4.27. definíció. A c c (GF(g)]" vektornak egy C ec IGF(g)]" vektorra történő le- 
képezése az alábbi: 


n—1 
Cj— ) ci, jJ7-O,1,...,n—-l, (4.23) 
i—0 


ahol a a GF(g) egy n-edrendű eleme. 
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A (4.23) transzformációt GF(g)-beli Fourier-transzformációnak nevezzük, 
így a c időtartománybeli vektor frekvenciatartománybeli megfelelője (spektruma) 
C. A (4.23) transzformáció rendelkezik a komplex számok feletti vektorokon kép- 
Zett transzformáció tulajdonságaival. (Komplex vektorok esetén a megfelelője a 
komplex n-edik egységgyök.) 

1. tulajdonság: A (4.23) leképezés kölcsönösen egyértelmű, azaz invertál- 
ható, és az inverz leképezés a következő: 


n—1 
ci— f(n) Ya C, i—0,1,...,n—l1, (4.24) 
J—-0 


ahol f(n) — (n mod p)"!, és a—1-edik hatvány az (n mod p) GH(p)-beli inverzét 
jelöli. 

Bináris test esetén (p — 2) n páratlan, így ekkor f(n) — 1 eredményre jutunk. 
Ha a. primitív elem, akkor n — p" — 1, tehát f(n) — (—1 mod p)"! —(p—1)7! 
mod p. Mivel n [ p"— 1, ezért p fn, azazn 5 0 mod p, és így létezik multiplikatív 
inverze mod pp. 

Mielőtt magát a tulajdonságot belátnánk, igazoljuk az alábbi lemmát. 


4.9. lemma. Ha a n-edrendű elem GF(g)-ban, akkor: 


n—1 
; 0 har £0 modn 
Ej , 
hi ( n modp, har—0 modn " 48.281 


BIZONYÍTÁS: Helyettesítsük az 
x2—-1—-(x— Drax? hx1) (4.26) 


azonosság mindkét oldalába 07 -t. A bal oldalon mindig 0-t kapunk, mivel c rendje 
n. A jobb oldalon r -— 0 mod n esetén 0" — 1 - 0, így a (4.26) szorzat csak akkor 
lehet nulla, ha a második tényezője 0, azaz ha 


míg r — 0 mod n esetén c" — I, így az első tényező nulla, és ekkor a második 
tényező 


n-1 ; n-1 
Yoa7J-)Y1-—n mod p. 
j—0 j—0 HI 
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A 4.9. lemma felhasználásával most már egyszerűen belátható az 1. tulajdon- 
ság. Nevezetesen 


n—1 3 n—-1 . n7-1 . 
yoaijcj — Vay ac — 
j—0 j—0 k—0 
n-1  n-1l 
k-0 — j—0 
— f(n ci. (4.2T) 


2. tulajdonság: Érvényes a konvolúciós tétel alábbi megfelelője: ha az e, f,g c 
[GF(ag)]" vektorokra 


ej; — figi, i—-0,1,....n—1 (4.28) 


fennáll, akkor a spektrumaikra 


n—-1 


E; zi f(n) ) F(j-k) mod nk. (4.29) 
k—0 


BIZONYÍTÁS: (4.28) figyelembevételével képezzük e transzformáltját: 
n-1 
Ej — ) 0" figi— 
1—0 
n-1 n—-1 . 
- PF arr Y aritGy — 
1—0 k—0 


n-1 n-1 
— fin EGYE aW 9 f; — 
k-0 — i—0 


n-1 


ezi fm) )3 GrF(j-k) mod n: 
k—0 
Ezzel az állítást beláttuk. HI 


A (4.29) szerinti konvolúciót ciklikus konvolúciónak nevezzük és: E— F:G 
módon jelöljük. A fenti levezetést fordított sorrendben elvégezve láthatjuk, hogy 
a 2. tulajdonság megfordítva is igaz, azaz (4.29)-ből (4.28) is következik. 

A továbbiakban az egyszerűség kedvéért g — 2" elemszámú testet (azaz 2 
karakterisztikájút) tételezünk fel, s ekkor f(n) — 1. A c — (co, c1,. . . , n—1) vek- 
torhoz rendelt c(x) — co Hcix-k rt en-1x! polinomhoz tartozó, C vektorral 
képzett C(x) — Co 4C1x- tb Cn-1x71! polinomot spektrumpolinomnak ne- 
vezzük. 
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4.29. tétel. A c(x) polinomnak ci akkor és csak akkor gyöke, ha C; — 0 illetve a 
C(x) polinomnak o! akkor és csak akkor gyöke, ha c; — 0. 


BIZONYÍTÁS: A (4.23), (4.24) egyenletek felhasználásával 
c(oi) 7 co -kciai LEISÉG c. 10 Di SC; 


C(o7) —Co-ECIOTT FC AAD — c; 


ahonnan az állítás közvetlenül adódik. HI 


Legyen az (n,k) paraméterű GF(g) feletti RS-kód generátorpolinomja g(x), 
aholn]g—1. Ekkor a c(x) kódszó c(x) — u(x)e(x) alakban állítható elő, ahol 
degu(x) Ck—l. 

A továbbiakban egy r(x) — ro 4-r1x7-:::-rjx! j-edfokú polinomhoz rendel- 
jünk egy n hosszú r vektort, amely legyen a következő: r — (ro, ri, . . . ,rj, 0, . . . , 0). 
Ezt és a polinomszorzás szabályát figyelembe véve egyszerűen belátható, hogy 
c,g és u vektorokkal 


Ü n—1 
GET SE A TE ásd (4.30) 
J—0 j—0 


i—0,1,...,n— 1. (4.30)-ban felismerve a c — g xu konvolúciót, a konvolúciós 
tétel alapján a C, G, U spektrumokra a 


Cj—-Gj:U; (4.31) 


összefüggés érvényes. 

Legyen g(x) — (x—1)(x— a) - :-(x— a!) az RS-kód generátorpolinomja, 
ahol a. a GF(g) egy n-edrendű eleme. Ekkor 1, . . . , 1! minden c(x)-nek 
gyöke, ezért tetszőleges u üzenethez tartozó c kódszó C spektrumában a 4.29. 
tétel felhasználásával 

Co— Ci —::r— Ch xk1—0 (4.32) 


zérus spektrumkomponensek adódnak. RS-kódot generálhatunk olyan ravasz mó- 
don, hogy eleve garantáljuk azt, hogy a kódszóspektrumok teljesítsék a (4.32) 
tulajdonságot, s a spektrum további komponenseit az üzenetektől függően külön- 
bözőkre választjuk. A tényleges időtartománybeli kódszavakat ezen mestersége- 
sen összeállított spektrumok inverz Fourier-transzformáltjainak választjuk. Így, 
ha egy 

C — (0,0,..., 0, uo, 1... ,4k—1) (4.33) 

— 


n-k 
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4.10. ábra. Transzformációs kódolás. 


vektort spektrumtartománybeli vektorként fogjuk fel, akkor az időtartománybeli c 
megfelelője egy kódszó. Ezen kódolást transzformációs kódolásnak nevezzük. 
A kódolás ekkor tehát a 4.10. ábrán látható blokkvázlat szerinti. 

A Reed-Solomon-kódok dekódolásának több módszere ismeretes. A Peter- 
son-Gorenstein-Zierler-algoritmus GF(g) feletti mátrixok invertálását igényli 
(lásd a 4.12. szakaszt). Ez az eljárás néhány hibát javító kód esetén számítás- 
igény szempontjából még elfogadható. A koncepció szempontjából jóval bonyo- 
lultabb Berlekamp-—Massey-algoritmus (Ber—Mas) iteratív eljárást ad, ahol az ite- 
ráció lépései azonosak és egyszerűek. Növekvő hibajavítóképesség esetén egyre 
kedvezőbb a számításigény a mátrixinvertáláshoz képest. Az alábbiakban az ún. 
transzformációs-kódolási—dekódolási technikát mutatjuk be. 

Tegyük fel, hogy a v — €3-e vett szóban az ij , i2 , . . . ,i; pozíciókban t számú 
hiba keletkezett, azaz a hibapolinom: 


e(x) —enx1 3. hegxi . (4.34) 


Az (n,k) paraméterű RS-kód 2t £ n — k teljesülése esetén képes a hibák ki- 
javítására. A továbbiakban a t jelölést az aktuális, míg a tmax jelölést a maximá- 
lisan javítható hibák számára használjuk. Az egyes hibákat a helyük és értékük 
definiálja (azaz ij és ejj). A dekódolás alábbiakban leírt módszerében először 
megkeressük a hibahelyeket — felépítve a hibahelypolinomot — majd ennek fel- 
használásával generáljuk a hibavektort, s ennek kivonásával elvégezzük a vett szó 
javítását. 

Az 





t 
L26)—-[T[(141— 0920) —1-4£1x7 hr L1x (4.35) 
j—1 

hibahelypolinom együtthatóit a rájuk mint ismeretlenekre vonatkozó megfelelő 
számú lineáris egyenletből álló egyenletrendszer megoldásaként kapjuk. Ezen 
egyenletrendszer levezetését ismertetjük először. 

1. lépés: Szindrómaszámítás 

A v — €7- e vektor Fourier-transzformáltját képezve a 


V-C-E (4.36) 
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spektrumot kapjuk, ahonnan (4.32) felhasználásával 
VI—E;, jJ7—-0O,l,.... n—k—1l (4.37) 


adódik, azaz a V spektrum első n — k komponense szindróma. 

2. lépés: A hibahelypolinom kiszámítása 

Az L(x) hibahelypolinom definíciójából következően L(o) —0, j — 1,2, . .. , 
t. Innen következik, hogy az L — (1, L1, L2 , . . . , Lr, 0, . . . 0) n-hosszra kiegészített 
vektor I inverz Fourier-transzformáltjában a hibahelyeknek megfelelő pozíciójú 
elemek is nullelemek. Ezen jelölésekkel az 


keőszsedő (4.38) 
kölcsönösen egyértelmű megfeleltetést kapjuk. Innen következik, hogy 
[; - ez — 0, i—0,1,...,.n—l, (4.39) 
amit a konvolúciós tétel felhasználásával az 
L:E—-—0 (4.40) 


ekvivalens alakba írhatunk. A (4.40) egyenlet ekvivalens a 


41- 


GE aászb  TZÜlaazi (4.41) 


Jj—0 


egyenletrendszerrel. Mivel maximálisan tmax hiba javítására készülünk fel, azaz 
amikor t £ tmax, ezért helyettesítsük a t változót a tmax fix értékkel a (4.41) egyen- 
letrendszerbe, L,41 — : : : — L..x — 0 definíció mellett, majd a (4.41) egyenletrend- 
szerből az alábbi tmax egyenletet emeljük ki 


tTmax 


E LJE; j —0, i—t t-41,...,2t—1. (4.42) 
J—0 


A feladat ezek után a (4.42) egyenletrendszer megoldása azzal a megkötéssel, 
hogy az L(x) megoldás minimális fokszámú legyen. 

A (4.42) alakú egyenletrendszerből kiindulva szokásos egyenletrendszer meg- 
oldással (mátrixinvertálással) dolgozik a Peterson-Gorenstein-Zierler- (PGZ) de- 
kóder. 

A feladat azonban más úton is megoldható. A (4.41) egyenletrendszer ekvi- 
valens módon megadható egy lineárisan visszacsatolt shiftregiszteres leírással. 

Ehhez felelevenítjük a 4.8. szakasz végén bevezetett a lineárisan visszacsatolt 
shiftregisztereket (LFSR) a 4.11. ábra segítségével. 
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4.12. ábra. A szindrómákat generáló LFSR. 


Az ottani jelöléseknek megfelelően (f(x), L) jelöli az LFSR-t. A mostani fel- 
adatunkban (L(x),t) LFSR generálja a szindrómák Eg, E! , E2 , . . . , En—1, Eo, Et, .  . 
periodikus sorozatát, ha az LFSR-t az Eg, E! , . . . , E.-1 kezdeti értékből indítjuk. 
Ez a generálás tehát a (4.41) egyenletrendszernek az 


E; si —(L1E j-1 tHL2Ej- 2 lszététk 3-LEj-:) (4.43) 


42 442 


rekurzióba történő átírását jelenti, ahol j tetszőleges egész szám és E; — E; modn. 
A (4.43) lineáris rekurziónak megfelelő LFSR generálást szemléltetjük a 4.12. 
ábrán. 

Az (L(x),t) LFSR egyben egyértelmű, minimális regiszterhosszú az összes 
olyan LFSR-ek közül, amelyek generálják a periodikusan kiterjesztett szindróma- 
sorozatot. Ez abból látható be, hogy a (4.43) rekurzió alapján felírható 


Eo El :--: Et L, —E, 
Ei Ez; -- E, L.-1 —E: 41 


(4.44) 


Ersi Er. sr Ex Li —E21—1 
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egyenletrendszerben a bal oldali, szindrómákat tartalmazó mátrix invertálható, s 
az egyenletrendszernek a tényleges hibavektorhoz tartozó hibahelypolinom egy 
megoldása. Azon egyenletrendszereknek, amelyeket úgy kapunk, hogy a (4.44) 
egyenletrendszerben a szindrómák indexét j — 0, 1, . . . , ((tmax —t) értékkel növel- 
jük, szintén egyértelmű, minimális megoldása a tényleges hibahelypolinom, ha 
t Z tmax fennáll. 

A dekódolás során csak az E;(— V;), i — 0,1, . . . , 2tmax — 1 szindrómák adot- 
tak. A shiftregiszter-szintézis feladat azon minimális t" fokszámú (L"(x),t") LFESR 
meghatározása, amely az Eg, E1 , . . . , Eu-1 kezdőállapotból elindítva generálja a 
további Ev, E1, . . . , E2rmax—1 elemeket is. 

A fentiekben láttuk, hogy amennyiben ft  tmax, akkor a szintézis az L"(x) — 
L(x), t — t megoldásra vezet. A minimális fokszámra törekvés megfelel a PGZ- 
dekódolásnál a szindrómákból alkotott tmax X tmax méretű mátrix legnagyobb in- 
vertálható főminorja megkeresésének. A Berlekamp-Massey shiftregiszter szin- 
tézis eljárásnál a mátrixinvertálás helyett egy jóval kisebb számításigényű, iteratív 
algoritmussal állítjuk elő a hibahelypolinomot. 

3. lépés: A rekurzív kiterjesztés 

AZ E2tnax " " : , Ex—1 komponenseket a (4.30) alapján az 


r 
E;—- FELE j, i — Vmax, ... n—1 (4.45) 
k—1 


rekurzív kiterjesztéssel állítjuk elő a 2. lépésben meghatározott L"(x) valamint 
Eg, . . . , E2tmax—1 felhasználásával. 
Ezután a 
€C—-—V-E (4.46) 


kivonással kapjuk meg C-t, amelynek szegmense az u üzenet. 


4.14. A konvolúciós kódolás alapfogalmai 


A blokk- illetve a konvolúciós kódok a hibajavító kódok két nagy osztályát al- 
kotják. Az egyszerűbb matematikai leírhatóság miatt a bevezető jellegű tanköny- 
vek elsősorban a blokk-kódokat részletezik, főleg azért, mert azokon jól bemu- 
tathatók a hibajavítás alapfogalmai és lépései, másrészt pedig azért, mert látvá- 
nyos algebrai struktúrák (pl. Galois-testek elméletének alapelemei) és optimális 
csatornakód-kontrukciók léteznek a blokk-kódok körében. 

A konvolúciós kódok leírása nem ilyen egyszerű, és a kódoptimalizálás is el- 
sősorban számítógépes keresésen, s nem konstrukciós tételeken alapszik. A prak- 
tikus paramétertartományok esetére ismeretes a jó kódok listája. 
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A blokk-kódok algebrai dekódolási algoritmusai olyan vett blokkokat képesek 
csak feldolgozni, amelyek elemei ugyanazon halmazból valók (tipikusan GF(2)- 
vagy GF(g9)9-beliek), mint amelyből a kódszavak veszik elemeiket, legfeljebb a 
törlés szimbólum engedett meg ezen felül a vett blokkokban. A konvolúciós kó- 
dok esetén a csatorna kimeneti ábécé ennél lényegesen bővebb halmaz lehet. A 
konvolúciós kódok ún. soft-dekóderei (pl. Viterbi-dekódolás, szekvenciális de- 
kódolás) megengedik, hogy a csatorna kimeneti ábécé elemei tetszőleges valós 
számok (mérési minták) legyenek. 

Létezik optimális (maximum-likelihood, ML), implementálható (számításigé- 
nyében gazdaságos) dekódolási algoritmus a konvolúciós kódokra, az ún. Viterbi- 
dekódolás. Természetesen az ML dekódolás elvileg a blokk-kódok esetén is el- 
végezhető, de a blokk-kódok esetén az exponenciális (adott kódoló mellett egy 
rövidített kód üzenethosszával exponenciálisan növekvő) bonyolultságú kimerítő 
keresésnél kisebb komplexitású ML dekóder nem ismeretes még speciális kódosz- 
tályokra sem. Ezzel szemben a Viterbi-dekódolás komplexitása adott kódoló mel- 
lett az üzenethosszal közel lineárisan növekvő. 


A konvolúciós kódok alkalmazásával lehetővé válik a moduláció és a csator- 
nakódolás illetve a demoduláció és a csatornadekódolás együttes tervezése. Így 
a konvolúciós kód struktúrák napjainkban nemcsak a hibajavító kódolásban, ha- 
nem például korszerű modulációs-demodulációs eljárásokban, diszperzív csator- 
nán történő megbízható adatátvitelben (csatornakiegyenlítés) is felhasználásra ke- 
rülnek. 


A léptetőregiszteres kódoló 


A forrás bitfolyamát k bites szegmensekre, ún. üzenetkeretekre bontjuk. A 
kódoló m üzenetkeretet tárol léptetőregiszterében, azaz egy időegység alatt egy új 
üzenetkeretet léptetünk a regiszterbe, a legrégebbi tárolt keret kilép abból, s azt 
eldobjuk. Az időegység kezdetén a bemenetre érkezett új keret valamint a tárolt 
m keret alapján a kódoló kiszámít egy kódszókeretet, amely n bit hosszúságú. A 
kódszókeretet kiléptetjük a kódolóból (4.13. ábra). 


Az R — k arányt kódsebességnek nevezzük. A bitekben kifejezett regisz- 
terhossz -k 1 (— (m-- 1)k) a léptetőregiszteres kódoló kényszerhossza. Egy, a 
kódolóhoz érkező üzenetbit maximum (mn -- 1)k forrásbitnek megfelelő hosszon 
befolyásolhatja a kódoló outputját. Az (m --1)n mennyiség neve blokkhossz, 
mely megmutatja, hogy egy forrásbit maximálisan hány csatornabitnek megfelelő 
hosszon befolyásolja a kódoló outputját. Az ismertetett konstrukció eredménye 
egy (n,k) fa-kód; a léptetőregiszteres kódoló bemenetére vezetve az összes lehet- 
séges félig végtelen hosszú input bitsorozatot, a kimenetén megjelenik az összes 
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4.14. ábra. Konvolúciós kódoló. 


különböző kódszó, amelyek úgyszintén félig végtelen sorozatok. Ha a fa-kód 
egyben véges kényszerhosszú is, azt trellis-kódnak nevezzük. Egy kód időin- 
variáns, amennyiben ha két input bitsorozat között csak 7 üzenetkeret időeltolás 
különbség van, akkor a nekik megfelelő output bitsorozatok (kódszavak) között T 
kódszókeret különbség van. Az időinvariáns trellis-kód a csúszó blokk-kód. 


4.28. definíció. Egy (n,k) fa-kódot, ha lineáris, időinvariáns és véges kényszer- 
hosszú, (N,K) konvolúciós kódnak hívunk, ahol K — (m--1)k, N — (m-- 1)n. 





A 4.14. ábra konvolúciós kódolója esetén m— 2,k — 1,n—-2,R 5 s a két 
lineáris kombináció: 





X2i-1  — WUjOUu;j 2 


X2i uj; OP uj. 1 Du. 2 
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i— 1,2,.... Az adott példa esetére elmondva, a konvolúciós kódolás elnevezés 
onnan származik, hogy az (11, u2 , . . .) üzenetbitsorozatot az (1,0,1,0,0,0, . . .) il- 
letve az (1, 1, 1,0,0, 0, . . .) sorozatokkal történő mod 2 konvolúció adja a páratlan 
illetve a páros pozíciójú csatornabiteket a kódoló kimenetén. 

A konvolúciós kódolóval blokk-kódolást is végezhetünk az alábbi módon. Te- 
gyük fel, hogy az u — (ui, 2, . . . , 4) üzenetet szeretnénk kódolni egy kódszóba. 
Egészítsük ki ezen üzenetet m - k zéró bittel, azaz képezzük az u" — (u1, 2 , . . . , UL , 
0,...,0) üzenetet. Ha zéró állapotból indítjuk a kódolót, akkor u! üzenetenként 
a zéró állapotba tér vissza (térítjük vissza), azaz L bites üzenetblokkokat blokk- 
kódolunk. Az R" névleges sebességű konvolúciós kódoló esetén ekkor 


L LA 


EE 4.47 
L--m-k ( ) 


a valós kódolási sebesség. A példabeli kódolás esetét tekintve pl. egy L — 3 bites 
üzenetblokkot 2 : (3 1-2) — 10 bites kódszóba kódolunk. 

A konvolúciós kódok ábrázolásának egyik módja a bináris fa reprezentáció. 
Példabeli kódolónk esetére láthatjuk ezt a reprezentációt a 4.15. ábrán. 

A fa csomópontjaiból két irányba léphetünk a kódolandó üzenetbitnek meg- 
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10 11 00 
11 ű ; 
00 . 01 . 11 
01 
1 . 00 , 00 , 1 
al lépés iránya 
10 : 10 E 0 E üzenetbit szerint 
"I 11 0 
01 SAL 00 
00 
11 ) 01 " II 
00 
00 j 00 B 00 
u1 u2 u3 0 0 


4.15. ábra. A kód bináris fa reprezentációja. 
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4.16. ábra. A kódoló állapotátmenet-gráfja. 


felelően. A fa éleit azon bitpárral (általában bit n-essel) címkéztük fel, amely a 
kódoló kimenetén megjelenik az aktuális üzenetbit belépése hatására. A gyökér- 
től a fa élei mentén a fa leveleiig vezető utak egy-egy kódszónak felelnek meg. 
Nyilván minden konvolúciós kódolónak megfeleltethető egy fenti bináris fa. A 
dekódolás szempontjából azonban szerencsésebb az ún. trellis reprezentáció. 

A trellis ábrázolást megkönnyíti, ha elkészítjük a kódoló állapotátmenet- 
gráfját, amelyet a példánk esetére a 4.16. ábrán láthatunk. 

Mindegyik állapotból két irányított él vezet egy másik állapotba. Az élen el- 
helyezett i/ jk jelölésben i az üzenetbit, jk pedig az ezen állapotátmenet során a 
kimeneten megjelenő bitpár. Így például az 10 állapotból az 1 üzenetbit belépése- 
kor az 11 állapotba megy át a kódoló, miközben a kimeneten az 10 bitpár jelenik 
meg. Ezek után tekintsük újra a bináris fa reprezentációt, s bővítsük ki ezt az ábrá- 
zolást úgy, hogy a csomópontokat állapotoknak feleltetjük meg, ahogy ezt a 4.17. 
ábrán láthatjuk a példa esetére. 

A 4.17. ábrát alaposabban szemügyre véve láthatjuk, hogy ha a fa azonos 
mélységében az azonos állapotoknak megfelelő csomópontokat egy állapot-cso- 
mópontnak tekintjük, akkor láthatjuk, hogy csak négyféle és nem nyolcféle eset 
áll elő. Például a 4.17. ábrabeli fának a szaggatott vonallal körülhatárolt két része 
összevonható. Ha összevonjuk ennek megfelelően az azonos állapot-csomópon- 
tokat egy csomópontba, akkor kapjuk a trellis reprezentációt, amit a példa esetére 
a 4.18. ábrán láthatunk. 


4.14. A KONVOLÚCIÓS KÓDOLÁS ALAPFOGALMAI 


11 





00 


11 














10 









































00 



































01 


























10 





ész zzel 








11 




















u1 














01 























00 














u2 





00 





























u3 


4.17. ábra. A kibővített fa ábrázolás. 
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4.18. ábra. A kód trellis ábrázolása. 
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A trellisben a csomópontokat összekötő élek címkéje az állapotváltozás során 
keletkező kimenet. Az egymást követő élek utat alkotnak, amelyek mindegyike az 
azonos kezdő (00 állapot) csomópontból indul, s azonos (00 állapot) végcsomó- 
pontba fut be. Az utak egy-egy kódszónak felelnek meg. A kezdő csomóponttól i 
él távolságra levő csomópontokról azt mondjuk, hogy i mélységben vannak. Így 
pl. egy mélységben kettő, kettő mélységben négy csomópontot tartalmaz a trellis. 

Azon kódokat, amelyek egy trellis ábrázolással leírhatók, trellis kódoknak ne- 
vezzük (ekkor nem kell felcímkézve lenniük a csomópontoknak). A konvolúciós 
kódolóval tehát olyan speciális blokk-kódolást végezhetünk, amely blokk-kód bi- 
náris fa-kód, továbbá olyan speciális fa-kód, amely trellis-kód is egyben. 

Polinomok alkalmazása a konvolúciós kódok esetén is segíti a tömör leírást. 
Egy konvolúciós kódoló léptetőregiszterének n számú lineáris előrecsatolását tar- 
talmazza. Az egyes előrecsatolásokat a megcsapolási pozícióknak megfelelően 
polinomokkal írhatjuk le. A 4.14. ábra szerinti kódoló esetén ez a g11(x) — 
x2 7-1, g12(x) — xx 1 bináris polinomokat jelenti. (Szokásos még az ún. 
oktális megadási mód, amelynél a polinom együtthatók hármas csoportjait oktális 
számokba képezzük. Például a fenti kódoló esetén [5,7] a kódoló oktális meg- 
adása.) Általános konvolúciós kód esetén g; j(x) az üzenetkeret i-edik bitje és a 
kódszókeret j-edik bitje közötti kapcsolatot írja le. 

A g:j(x) generátorpolinomokat mátrixba rendezve kapjuk a 


G(x) — [gi 001] 


k x n méretű generátorpolinom-mátrixot. 

Ha d;(x) jelöli az egymás utáni üzenetkeretek i-edik bitje félig végtelen soro- 
zatának megfelelő polinomot, s hasonlóan cj(x) a kódszókeret j-edik bitjei félig 
végtelen sorozatának megfelelő polinomot, akkor a 


d(r) — [d1(x) ,d2(x9), . . . dr] 
e(x) — [c1(x), c2(x), . . . , cn 0] 
jelölésekkel a 
generálási szabály adódik. 


4.29. definíció. Egy konvolúciós kód katasztrofális, ha tetszőlegesen nagy Ham- 
ming-súlyú input sorozat esetén korlátos Hamming-súlyú marad az output. 


Ezen definíció alapján könnyen belátható az alábbi tétel. 
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4.19. ábra. Katasztrofális kódoló (g11(x) — x-- 1 és g12(x) — x? 1). 
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4.20. ábra. A katasztrofális kódoló állapotátmenet-gráfja. 


4.30. tétel. Egy kód katasztrofális tulajdonságának szükséges és elégséges felté- 


tele az, hogy az állapotgráfjában létezzen egy hurok, amelyet alkotó valamennyi 
élen a kódszókeretek zérus súlyúak. 


A 4.19. ábrán egy katasztrofális kódolót látunk. Ennek állapotátmenet-gráfja 
a 4.20. ábrán látható, ahol vastag vonallal jelöltük a zéró súlyú hurkot. 

k — 1 paraméterű kódok esetén az alábbi tétel egy még praktikusabb ellenőr- 
zésre ad lehetőséget: 
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4.31. tétel. zh sebességű kód esetén a nem katasztrofális tulajdonság fennállásá- 
nak szükséges és elégséges feltétele, hogy 


Inkol[g11(x), g12(x), : . . . f1n(x)]— 1 


legyen. 


MEGJEGYZÉS: ,Jó?" konvolúciós kód konstruálása tehát azonos feladat relatív 
prím polinomok egy , jó" halmazának konstruálásával. Sajnos erre a feladatra nem 
állnak jelenleg még rendelkezésre olyan általános konstrukciók, mint a blokk- 
kódok esetén. 


BIZONYÍTÁS: Tekintsünk egy z sebességű (k — 1) nemkatasztrofális kódot. Tet- 
szőleges kódtól megköveteljük, hogy létezzen a kódolás inverze. Az euklidészi 
algoritmus alapján léteznek (és elő is állíthatók) azok az a1(x),a2(x), . . . , an(x) 
polinomok, amelyekkel 


a1(x)g11(x) 4 a2 0) g12(x) h-t an()gin(x) — 1 


adódik. Ha d(x) az adatpolinom (mivel k — 1, ezért egy polinomról van szó), 
akkor 

cj(x) —d(0)gi1j(), JEL ZD sen 
a kódszókeretek j-edik bitjét leíró polinom, tehát a d(x) adat könnyen ellenőriz- 
hetően a 


d(x) — a1(x)ci1(x) — a2(x)c2(x) — : : : Fan (x)en(x) 


művelettel nyerhető vissza. 
A kódoló és inverze a 4.21. ábrán látható. Véges súlyú c(x) polinomok véges 
súlyú aj(x) polinommal való szorzata is véges súlyú. J 


Az r-edik minimális távolság egy konvolúciós kód esetén a legkisebb Ham- 
ming-távolság a kódoló output sorozatok első r kódszókeret hosszú (rn bit) szeg- 
mense között. Jelölése: d". Nyilván 


dí £ d3 S d3 £ - ee 
A dí, d2 , d3 , . . . Sorozat a konvolúciós kód távolságprofilja. 
d.a — max d 
F ak 


a szabad távolság. 
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4.21. ábra. Kódoló és inverze. 
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4.22. ábra. Jelkészlet példák: 2,4 szintű AM, 4,8 szintű PSK. 


Konvolúciós kódok komplex ábécé felett (Ungerboeck-kódok) 


Az (n,k) konvolúciós kódoló a k bites üzenetkeret inputokat egy-egy kódo- 
lási lépésben 2" méretű komplex számhalmaz egy elemére képezi le. A komplex 
számhalmazt jelkészletnek hívjuk. Tipikus példáit láthatjuk a 4.22. ábrán. 

Két kódszó távolságát euklidészi távolságban mérjük: 


de(c1,c2)2— ) lew— ca? 
1—0 


ahol cz és cz komplex elemű konvolúciós kódszavak. Ennek megfelelően euklidé- 
szi távolságokban adódnak a kódtávolság jellemzők. A kódoló gaussi csatornán 


4 


történő alkalmazásakor ez a kódteljesítmény legalkalmasabb mértéke. Ugyanis 
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AD) - (1) 
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—— tk (0) 


4.23. ábra. Bináris (3,2) konvolúciós kódoló. 


annak P., valószínűsége, hogy hibás kódszóra döntünk 


Pe 2 Na (s) , 
26 


ahol $ a standard normális eloszlásfüggvény, c a gaussi zajminta szórása, Ng 


pedig a zérus kódszótól d minimális euklidészi távolságra lévő kódszavak száma. 
A kódolási nyereséget 


do 
dref 
definiálja, ahol a der a kódolatlan esetben adódó minimális euklidészi távolság. 
Egy példát láthatunk a 4.23. ábrán. A (3,2) konvolúciós kódoló egy lépésben 
a bemenetére érkező bitpárt output bithármasba, majd azt a 8$PSK jelkészlet egy 


elemébe képezi. 
x xXil 0 
is fi 0 1) 


A 3 bites output 8PSK jelkészletbe (459-os szöggel forgatott komplex egy- 
ségvektorok) történő leképezése a 4.24. ábra szerinti (a bithármasok bitsorrendje 
sorban a 0, 1, 2 outputpozícióknak felel meg). A jelkészlet elemei közötti eukli- 
dészi távolságokat a 4.25. ábrán láthatjuk, ahol da — V2— v2, di — V2, d? — 
V27 2, dz — 2. 

A kódoló trellisének egy részlete látható a 4.26. ábrán, ahol az ágakon a $PSK 
jelek bináris indexét, illetve az input bitpárt tüntettük fel. Egy csomópontból két 
él vezet minden utána következő csomópontba. A vastag vonallal kiemelt hurok 
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000 100 010 110 
0 1 2 3 
001 101 011 111 
4 5 6 7 


4. Lz 


4.24. ábra. A 3 bites output $PSK jelkészletbe történő leképezése. 
do 


di 


d? 
d3 e 





4.25. ábra. A jelkészlet elemei közötti euklidészi távolságok. 


a csupa zérus kódszótól minimális euklidészi távolságra eltérő kódszónak felel 
meg. 

Egyszerű vizsgálattal megállapítható, hogy ezen hurok a 01 00 00 input bitpá- 
rok (üzenetkeretek) hatására jön létre, s akódszó Hamming-súlya 3. A hurokra írt 
8PSK jelek távolságát a 0 jeltől képezve kapjuk, hogy az euklidészi metrikában 
mért kódtávolság 





d7 -- dő -- d? — jazz gas z 6 SAL 


Ahhoz, hogy a der referencia euklidészi távolságot megállapíthassuk, tekintsük 
a kódolatlan esetet. Ha nincs kódolás, akkor a 2 bites üzenetkeretet közvetlenül 
4PSK jelkészlet elemeibe transzformáljuk, amely jelkészletet a 4.27. ábrán láthat- 
juk. Az ábra alapján nyilvánvaló, hogy ekkor a minimális euklidészi távolság a 00 
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01/001 01/001 01/001 


00 


01 


10 
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4.26. ábra. A kódoló trellis reprezentációja. 


4.27. ábra. 4PSK. 


00 00 . . . zérus sorozathoz képest a 01 00 00 . . . sorozatra adódik, azaz 
dref sz di sss 2. 


Tehát a kódolási nyereség G — 201og1g ER) - 3.6 dB. Az egyszerű kódot te- 
kintve ez igen jó eredmény. Az Ungerboeck-kódok jelentőségét még könnyebben 
láthatjuk, ha észrevesszük, hogy a kódolatlan 4PSK adó-vevőbe a 4PSK modulá- 
tor helyébe mindennemű konverzió nélkül beillesztve az Ungerboeck komplex kó- 
doló illetve dekódoló blokkot, minden egyéb fizikai feltétel (azonos forrássebes- 
ség, adási teljesítmény, sávszélesség) változatlanul maradása mellett figyelemre- 
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méltó kódolási nyereséget érhetünk el, illetve a kódolási nyereséget kisebb jel/zaj 
igénybe konvertálhatjuk, azaz kisebb adási teljesítmény igényünk lesz. 

A CCITT V.32bis modemszabványa is Ungerboeck-kódot használ, s ezzel az 
átviteli sebességet 14.4 kbps-ra növeli a korábbi technikához képest. (Pl. az 1964- 
ben megjelent V.21-es szabvány csak 200 bps-ot tudott biztosítani.) 


4.15. A konvolúciós kódok Viterbi-dekódolása 


A Viterbi-dekódolás a trellis kódok maximum-likelihood (ML) dekódolására 
optimalizált algoritmus. 

A dekódolás algoritmusának egyszerűbb szemléltetése kedvéért tekintsünk 
egy p paraméterű bináris szimmetrikus emlékezetnélküli csatornát (BSC), ahol 
0£pa 5. Ezen csatornára X — (Xx1,x2, . . . , Xn ) input vektor és y — (y1,y2,...,yn) 
output vektor jelölés esetén 


d(xy) 
P(ylxj—(1—p)" 5) (4.48) 


ahol d(x,y) a vektorok Hamming-távolsága. Mivel 0 p c 5 ekvivalens a0 c 
17 a 1 állítással, ezért y vétele esetén az ML dekódolás ekvivalens a minimális 
Hamming-távolságban levő kódszó (input vektor) megkeresésével, azaz 


max Pfy Ixiy —  mindí(y,x;). (4.49) 


A (4.499-ben jelzett művelet távolságmérést és minimumkeresést jelent, ahol L 
az üzenethossz. Ennél azonban sokkal kisebb számításigénnyel is megoldható a 
feladat. Tudjuk, hogy a kód trellisének útjai az egyes kódszavaknak, s az ezen 
utakat alkotó élek a kódszavak n bites szegmenseinek felelnek meg. Ennek meg- 
felelően, ha a trellis éleit súlyozzuk az y és x; megfelelő n bites szegmensének 
a Hamming-távolságával, akkor az x;-nek megfelelő út összsúlya megegyezik a 
d(y, xi) Hamming-távolsággal. 

Ekkor tehát dekódolási metrikaként a Hamming-távolságot használjuk. Álta- 
lában diszkrét emlékezetnélküli csatorna (DMC) esetén 


N 


logPfyIx)— d) logPfy; ]xj), (4.50) 
j—I 


s ekkor a j-edik mélységben levő ágat logP(fy;j ] xj) metrikával súlyozva ismét 
élenként additív metrikához jutunk, azaz az utak súlya az alkotó élek súlyának 
összege. Ezen fogalmak bevezetése után megadjuk a Viterbi-algoritmust. Az 
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egyértelműség kedvéért tegyük fel még, hogy a maximális súlyú utat keressük. 
A feladat tehát egy speciális irányított grátban maximális súlyú út keresése. A 
Viterbi-algoritmus nem más, mint egy dinamikus programozási eljárás ügyes al- 
kalmazása a konvolúciós kódok dekódolására. 


A Viterbi-algoritmus 


Tegyük fel, hogy a trellis i-edik mélységében ismerjük minden e mélység- 
beli csomópontba befutó azon utat, amelynek súlya ezen csomópontig maximális. 
Ezen részutakat az i mélységbeli túlélőknek nevezzük. Az i-edik mélységben tá- 
roljuk ezen túlélőket, valamint a túlélők súlyát. 

Az i-3-1 mélységbeli túlélőket úgy határozzuk meg, hogy meghosszabbítjuk az 
i mélységbeli túlélőket a lehetséges folytatás élekkel, s az egyes i t- I mélységbeli 
csomópontokba a különböző i mélységbeli csomópontokból befutó egy-egy éllel 
meghosszabbított túlélőkből az lesz az új túlélő, amelyiknek nagyobb az egy ág 
súlyával megnövelt súlya. 

Mivel a trellis útjai egy végcsomópontba futnak, ezért legvégül egyetlen túlélő 
marad, a maximális súlyú út. 


4.17. példa. A 4.18. ábra trellise esetére legyen y — (0, 1,0,1,0,1,0,1,1,1) a vett 
kódszó, ekkor a 4.28. ábrán követhetjük végig a dekódolás menetét. 

A trellis csomópontjai felett jelöltük az adott csomópontba befutó minimális 
Hamming-távolságú részút (azaz a túlélő) súlyát, továbbá áthúzással jelöltük a túl- 


2 4 


élési versenyből kiesett részutak megfelelő éleit. A csomópontok felett megadott 
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4.28. ábra. Viterbi dekódolási példa. 
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számértékek a túlélő részutak súlyát jelentik. Figyelmesen végigkövetve az algo- 
ritmus lépéseit, eredményül az (1,0,1,0,0) két 0-val meghosszabbított dekódolt 
üzenetet kapjuk. 


4.16. A Viterbi-dekódolás bithibaaránya diszkrét, emlé- 
kezetnélküli csatornán 


A következő részben egy módszert mutatunk a konvolúciós kódok ML dekódolása 
esetén elérhető dekódolási bithibaarány számítására DMC esetén. 

A lineáris blokk-kódokkal kapcsolatos tanulmányokból ismeretes, hogy adott 
csatorna esetén a minimális kódszótávolság (röviden minimális távolság) nagy- 
sága döntően befolyásolja a kódszó-dekódolási hibaarányt. Hasonló a helyzet a 
konvolúciós kódokkal kapcsolatosan is, ezért első lépésként a kódszótávolság tu- 
lajdonságokat elevenítjük fel röviden. 

A kódolás linearitása miatt itt is elegendő a csupa 0 kódszótól mérni a Ham- 
ming-távolságokat, amit a következőképpen láthatunk be. Legyen u és u! két 
különböző kódolandó üzenet, s jelölje f(u) illetve f(u") a megfelelő kódszót, 
amelyet konvolúciós kódolóval a fentiekben részletesen elemzett blokk-kódolás 
üzemmódban nyertünk. Ekkor a 


d(fu), fu) —dífu) efa, fu eoru)) —d 0, fuou)) (4.51) 


egyenlőségláncot kapjuk, ahol f linearitását használtuk fel. (4.51) alapján tehát 
f(u) és f(u") kódszavak távolsága megegyezik egy nemzérus f(u gu") kódszó 
csupa 0 kódszótól mért távolságával. Következésképpen a lehetséges kódszó- 
távolságok megegyeznek a nemzérus üzenethez tartozó kódszavak csupa zérus 
kódszótól mért távolságával, s ez az amit be akartunk látni. 

Tegyük fel tehát, hogy a csupa 0 kódszót adjuk a csatornába. Kódoló példánk 
folytatásaként a 4.29. ábrán láthatjuk a csupa 0 kódszót, s egy nemzérus üzenethez 
tartozó kódszót. 

A 4.29. ábra nemzérus kódszava d — 6 Hamming-távolságra van a zérus kód- 
szótól, továbbá a neki megfelelő (1,0,1,0,0) üzenet i — 2 nemzérus üzenetbitet 
tartalmaz. Ha tehát a zérus kódszó helyett hibásan ezt a kódszót dekódolnánk, 
akkor az 2 bithibát okozna. 

A konvolúciós kódoknál — a blokk-kódoktól eltérően — az egy kódszóba kó- 
dolandó üzenethossz, s így a kódszóhossz, elvileg szabadon válaszható paraméter. 
A dekódolás hibaanalíziséhez szükségünk lesz a kódszavak súlyeloszlására. Tud- 
juk, hogy a kódszavaknak utak felelnek meg a kód trellisében. Vezessük be az 
a(d,i) jelölést a zéró kódszónak megfelelő útból (zéró út) az 1. csomópontban le- 
ágazó azon utak darabszámára, amelyek d Hamming-távolságra vannak és i súlyú 
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4.29. ábra. Zérus kódszóból leágazó nemzérus kódszó. 


üzenethez tartoznak. Bár véges méretű (L bit) üzenetblokkot kódolunk egy lé- 
pésben, technikailag egyszerűbb az a(d,i) eloszlás számítása ha végtelen hosszú 
üzenetblokkok kódolását vizsgáljuk. 


4.18. példa. A 4.14. ábra kódolója esetén a(d, i) — 0, ha d — 5, továbbá a(5, 1) — 
1 aló DEZ ss 

Vezessük be az (a(d,i) : i,d — 1,2, . . .) kétindexes sorozathoz rendelt formá- 
lis hatványsort: 


8 


D18 


T(D,T) — a(d, TD". (4.52) 


i—1d—1 


(A formális hatványsorok tulajdonságaival kapcsolatosan utalunk pl. [34] 10.3. 
pontjára). 


4.19. példa (T(D,I) meghatatározásának egy módszere). 
A 4.16. ábrán látható állapotdiagramot a 4.30. ábrán látható folyamatgráffá ala- 
kíthatjuk. 

A leágazás-folyamatgráf A , B jelű csomópontja a 00 állapotnak, míg az X, Y,Z 
jelű csomópontok a három nemzéró állapotnak felelnek meg. Így a leágazás- 
folyamatgráf A bemeneti pontja a zéró útból történő leágazásnak, míg a B kimeneti 
pontja az abba való első visszatérésnek felel meg. A gráf éleinek címkéje IDF, 
ha ezenél j — 0 vagy j — 1 üzenetbit hatására jött létre, illetve k Hamming-súlyú 
szelete a megfelelő útnak. Egy úthoz az élei címkéinek szorzatát rendeljük. A 
leágazás-folyamatgráf A bemeneti és B kimeneti pontja közötti utakra így kiadódó 
értékek összege a keresett T(D, 1) sort adja. 


Példabeli kódolónk esetén az 


X — ID7A 7 IZ, 
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4.30. ábra. A konvolúciós kódoló leágazás-folyamatgráfja. 


Y — IDX 7-IDY, 
Z-DX-7DY, 
B — DZ 
lineáris egyenletrendszerből 
B-T(D,T)-A 


felhasználásával, T(D,I) megkapható: 


ID? 
TDD)—-T-zID 





— IDÍ(1421D-3-4PD? 3. . .). (4.53) 


Innen kiolvasható a keresett súlyeloszlás: 


i—1 zsé Bsz 
TEN símán ek sa ÉK 
Működjön a kódoló blokk-kódolóként véges üzenethosszal, használjuk a Vi- 
terbi-dekódolást. A dekódolás eredménye egy a leadott zéró úttól esetleg eltérő 
út, amely bizonyos csomópontokban leágazhat a zéró útból, majd egy későbbi 
csomópontban visszatérhet bele, s esetleg újra elágazhat belőle. 
A dekódolt út szakaszokra bontható: egyes szakaszain együttfut a csupa zéró 
úttal, majd leágazik, s visszatér abba. A leágazástól a visszatérésig tartó rész- 
utat huroknak nevezzük. A fentiekben megállapítottuk a hurkok a(d,i) eloszlását. 
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Jelölje a W; valószínűségi változó az üzenetbit-hibák számát a dekódolt út j-edik 
mélységben induló hurokjában ( j — 0, I , . . . L— 1). Definíció szerint legyen W; — 


0, ha nincs leágazás a j-edik pontban, vagy ha egy j-t megelőző pontban indult 


egy hurok, s még nem tért vissza a zéró útba. 
L-1 
HaL jelöli az üzenethosszt, akkor W; definíciója alapján nyilván az n — p8 W; 
FF 


összeg az üzenetbithibák számát adó valószínűségi változó. Az 1 valószínűségi 


változó adja az egy dekódolt bitre eső bithibaarányt. Ennek várható értékével 
definiáljuk a P, átlagos bithibaarányt, azaz 


L W; 
P,—-E szi 4.55 
b 2 7 (4.55) 
j7l 

DMC esetén nem nehéz felső becslést adni annak a valószínűségére, hogy 
az átküldött zéró kódszó helyett egy attól d Hamming-távolságra levő kódszóra 
döntünk ML dekódolás esetén. Bevezetve ezen (pár-) hibázás esemény valószínű- 
ségére a Pe pár valószínűséget, arra egy 


Pe pár s (27997 (4.56) 


alakú felső becslés adható, ahol w 2 0 az adott csatorna paramétereitől függő 
mennyiség (pl. w a Bhattacharyya-távolság). Ez a következőképp látható be. Le- 
gyen xi a leadott kódszó, x2 egy tőle d távolságra levő kódszó, valamint legyen 
y a vett szó. A vételi oldalon természetesen nem tudjuk, hogy XI volt a leadott 
kódszó, s így y ismeretében az xi illetve x2 kódszavak közül a valószínűbben 
leadottra szeretnénk dönteni. Vezessük be a D1, D2 ML döntési tartományokat, 
ahol 


yeDi, ha Pfylxij2Plyix2j, 
yeD2, ha Pfy]lxoj2Pfylxib. (4.57) 


Hibát akkor követünk el, hay c D2. Ennek megfelelően a hibavalószínűség 


Popár— B Pfylxi)- (4.58) 
yeD2 


(4.57) és (4.58) alapján a következő felső becslést adhatjuk: 





É 5 Pfy]xoj 
Pe pár kes pe j it PfyIxi) S; 
c YE vPfylxijPfy]x2j— 


y 


4.17. REKURZÍV KONVOLÚCIÓS KÓDOLÁS 269 





II 
ez 


II 
isa 


n 


p vVPty XintPfy ] ma) He 
y 


d 
E Pfy]0jPfy] mp) ; (4.59) 


y 


ahol az utolsó lépésben kihasználtuk, hogy azon n-ekre, amelyekre X1n — X2n, a 
szumma 1-gyel egyenlő. Bevezetve a 


w — — log; E vVPfyI0jPfy] mp) (4.60) 
5 


jelölést, a bizonyítandó (4.56) felső becslésre jutunk. 

Vezessük be az aj(d,i) jelölést a vizsgált véges üzenethosszra a zéró kódszó- 
nak megfelelő útból (zéró út) a j-edik csomópontban leágazó azon hurkok darab- 
számára, amelyek d Hamming-távolságra vannak és i súlyú üzenethez tartoznak, s 
amelyek legkésőbb az L-edik mélységben visszatérnek. Nyilván aj(d,i) £ a(d,i) 
tetszőleges d, i és j esetén. 

Az eddigiek alapján az 


E(W;) c ea jkd ST (4.61) 


felső becslést kapjuk, ahonnan a (d, i) £ a(d,i) felhasználásával a 


P, e EY Yi a(d, )(27Yy (4.62) 
i d 
eredményt kaphatjuk. A (4.52) és (4.62) összefüggések egybevetésével a 
O9T(D,I 
Pc ELSE] (4.63) 


JI 


1-1, D—2-w 


praktikus végformulához jutunk. 


4.17. Rekurzív konvolúciós kódolás 


A 4.14. szakaszban láttuk, hogy a konvolúciós kódokat generálhatjuk előrecsa- 
tolt shiftregiszterek segítségével. Ha a regiszterek tartalmát valamilyen lineáris 
logikán keresztül visszacsatoljuk a kódoló bemenetére, egy általánosabb kódosz- 
tályhoz jutunk, a rekurzív (visszacsatolt) konvolúciós kódokhoz. Ezek a kódok 
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4.31. ábra. Visszacsatolt konvolúciós kódoló. 


szintén lineáris időinvariáns fa-kódok, ám a kényszerhossz a legtöbb esetben vég- 
telen: egy darab 1-es bit végtelen hosszú ideig keringhet a kódolóban, így egy egy 
súlyú bemenet végtelen súlyú kimenetet generálhat. Ez a tulajdonság igen hasz- 
nos lehet bizonyos kódkonstrukcióknál, például a 4.18. szakaszban tárgyalt turbó 
kódoknál. Az előrecsatolt konvolúciós kódokhoz hasonlóan továbbra is csak bi- 
náris kódokkal foglalkozunk. 

A visszacsatolt kódoló struktúrája a 4.31. ábrán látható. Itt 


d, sz. [do 1, út , dr.x] 


FRNE A 


jelöli a kódolóba a t időpontban belépő k bites üzenetkeretet, 


C; — [dr1 te. , Crnl] 


4. z 


az onnan kilépő n bites kódszókeret, végül pedig 


u, — [11 ules , Ur] 


42 


a shiftregiszterbe a t időpontban belépő szintén k bites úgynevezett állapotkeretet. 

A kódolót két generátorpolinom-mátrixszal írhatjuk le, hiszen a shiftregiszter- 
ben tárolt állapotkeretek nem csak a kimenetet, hanem a shiftregiszterbe belépő új 
állapotkeretet is befolyásolják (az előrecsatolt esettel ellentétben a regiszter nem 
az üzenetkereteket, hanem azoknak egy módosított változatát, az állapotkerete- 
ket tartalmazza). Vegyük észre, hogy a bemenet közvetlenül nem befolyásolja a 
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kimenetet, hiszen az első kicsatolás az első összeadó után van. (Ez az analízist 
megkönnyítő elrendezés azonban nem jelent megszorítást, hiszen az előrecsatoló 
súlyok alkalmas megváltoztatásával ez a kicsatolás az összegzés elé hozható.) Az 
előrecsatolást a k x n méretű 


G(x) — [gi 00) 


mátrix határozza meg, ahol g; j(x) — 8: jogi, jaxt:""-H8i,jmx" írja le az állapot- 
keretek i-edik és a kódszókeretek j-edik bitje közötti összefüggést, ahol m — az 
előrecsatolt konvolúciós kódoknál használt jelölésekhez hasonlóan — a kódoló 
regisztereinek száma. Az állapotkeretek i-edik és az új állapotkeret j-edik bitje 
közötti kapcsolatot a h; j(x) — hi jo Ajax tt Aj mx7" polinom írja le, ahol 
h; jo, a konstans tag együtthatója, az üzenetkeret i-edik bitjének hatását mutatja 
az új állapotkeret j-edik bitjére. A h; j(x) polinomokat mátrixba rendezve kapjuk 
a visszacsatolást meghatározó 


HC) — [hi (0) ] 


k x k méretű négyzetes mátrixot. A továbbiakban azzal a tipikus esettel foglalko- 
zunk, amikor 

— a . J 1, hai—j 
hi. jo re 8; j ús ( 0, ha i £ j jé 


Ennek szemléltetésére a 4.31. ábrán a bemenetet közvetlenül nem is vezettük be a 
visszacsatolást leíró H(x) blokkba. 


4.20. példa. A 4.32. ábrán egy egy bemenetű egy kimenetű visszacsatolt konvo- 
lúciós kódoló általános sémája látható. 


A rekurzív konvolúciós kódok az előrecsatolt konvolúciós kódokkal teljesen 
analóg módon kezelhetőek. Ugyanúgy elkészíthetjük a kódoló állapotgráfját, trel- 
lisét, és a Viterbi-dekódolást is változtatás nélkül alkalmazhatjuk. Mindebből kö- 
vetkezik, hogy a Viterbi-dekódolás bithibaarányára korábban adott felső becslés 
is érvényben marad. 

A továbbiakban meghatározzuk az előrecsatolt konvolúciós kódoknál már meg- 
ismert 


c(x) — [c1(x), . . . , cn(x)] 


kódszópolinom-vektort a 


d(x) 7 [di (x), JÉ zás , dx] 
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4.32. ábra. Visszacsatolt konvolúciós kódoló, k— 1,n— 1. 


üzenetpolinom-vektor segítségével, ahol 


cj(x)— co jtcijxtc2j(x) A... TE lsz 


dj(x) — do,j 4 di, jx 4 d2 j(x) A . . . J—-Llsszk 
A levezetéshez szükségünk lesz még az 
u(x) — [u1(x), . . . , ux()] 
állapotpolinom-vektorra, melynek elemei az 
uj(x) — 40 ju jx u j(x) A... TET sk 
polinomok. Ha a kódolót a csupa nulla állapotból indítjuk, akkor definíció szerint 


legyen u; j — 0, hat — —1,...,—m és j— 1,...,k. Ekkor a visszacsatolásokat 
figyelembe véve az 


m k 
Uj — A hja —t 4 dj (4.64) 
1-1 i—1 
alakú egyenletekhez jutunk minden tf — 0,1,... és j— 1,...,k értékre. Szoroz- 


zuk meg a (4.64) egyenletet x/-nel, és a kapott egyenleteket összegezzük minden 
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nemnegatív t-re. Ekkor 


ID18 
S 
hee? 
s 
! 


uj(x) — 


I 
PD18 
Es 


h; ,j 114t—L iX aEdgy- BE 


II 
o 
szi 
II 
jéa 
II 
jei 


s 


I 
D18 
D1 
va 


Z t1—I t 
hi j1xX uo gx y d: jx — 
1—0 


hi, ax part 26 Ed pl — 


ti t1—0 


II 
saj 
II 
szi 


av] 


1 


0 
m 
1 


1— 


k m 
— EA hip ui (x ) -dj(x). 


i—17—1 


Figyelembe véve, hogy bináris kódokkal dolgozunk és h; jo — ő; j, a 


m- 


dj(x)— Dig dux) — [10 . ax In 00), . . xy TT 


i—1 


egyenletekhez jutunk, j — 1, . . . ,k. Innen pedig a 
d(x) — u(x) H(x) 


kifejezéshez jutunk, amiből 


u(x) — d(x) HT! (x) 


adódik, ahol H7! (x) a H(x) inverze. Ekkor, mivel a kimenet megkapható egy u(x) 
bemenetű G(x) előrecsatolású konvolúciós kódoló segítségével, az előrecsatolt 
konvolúciós kódoknál bizonyítottak alapján a kódszópolinom-vektor a 


c(x) — d(x)H!(x)G(x) (4.65) 
formában írható. Az igen fontos k — 1 speciális esetben 
d1(x) 
hia(x) 


adódik. Azon speciális esetben, amikor nincs visszacsatolás, azaz a kódolónk 
ténylegesen egy előrecsatolt konvolúciós kódoló, H(x) éppen a k x k méretű egy- 
ségmátrix, és így (4.65) a korábban már megismert c(x) — d(x) G(x) összefüg- 
gésre egyszerűsödik. 





c(x) — [g1,1 (2), . ... g1n(0)] (4.66) 
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4.33. ábra. Rekurzív szisztematikus konvolúciós kódoló. 





4.21. példa. A 4.33. ábrán látható rekurzív szisztematikus konvolúciós kódoló 
esetén g12(x) — 1 hxt és hia(x)—1 4Fx-Rx? ha? hat. Vegyük észre, hogy az 
első kimenet kicsatolása az első összeadó előtt történik, és nyilván c1(x) — d1(x) 
(ez egyébként némi átrendezés után megfelel a g1 1(x) — hi, 1(x) esetnek). Ekkor 


e(x) — lei(9 cz] — 
gi2(x2) V 
d1(x) ME 5) sz a 


1-4x 
z.-gtgld : 4.67 
1) ( TESZ EE] SZAVA 





4.18. Turbó kódok 


A turbó kódok a kódelméleti kutatás legújabb vonalát jelentik. 1993-as felfe- 
dezésükkel (Berrou, Glavieux és Thitimajshima [9]) megjelentek az első olyan 
praktikus kódok, melyek jelsebessége megközelíti a csatornakapacitást. Jelen pil- 
lanatban úgy tűnik, hogy széles körű elterjedésüknek csak a kódolás és dekódo- 
lás során fellépő nagy késleltetés, illetve a viszonylag nagyobb komplexitás szab 
határt (bár ez utóbbi tekintetben igen biztató eredmények is megjelentek már, pél- 
dául [29]). Az űrtávközlésben napjainkra a turbó kódokat alkalmazzák leggyak- 
rabban (például EN 301 790 szabvány), és alkalmazásukat az UMTS szabvány 
(4.19. szakasz) is javasolja. 

Az eljárás alapgondolata az, hogy a 4.34. ábra szerint bitkeverők közbeiktatá- 
sával párhuzamosan kapcsolunk több kódolót, az úgynevezett komponenskódoló- 
kat, és ezek kódszavait összefésülve kapjuk a tényleges kódszót. A gyakorlatban 
a komponenskódok leggyakrabban visszacsatolt konvolúciós kódok. 

A dekódolás során a komponenskódokat külön-külön dekódoljuk, azonban 
a dekódolás során felhasználjuk a többi komponenskód dekódolása során kapott 
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4.34. ábra. A turbó kódoló általános struktúrája. 


eredményeket. A tapasztalatok szerint az így elérhető hibavalószínűség nagyság- 
rendekkel kisebb lehet, mint ha az egyes komponenskódokat külön-külön használ- 
nánk. n kódoló összekapcsolása esetén egy 1/n sebességű kódot kapunk. Ahhoz, 
hogy a kódsebességet az alkalmazások igényei szerint alakíthassuk, az egyes kom- 
ponenskódszavak bizonyos bitjeit egy előre meghatározott minta szerint töröljük, 
azaz nem továbbítjuk. A vevőben a törölt bitek pozíciója ismert, így a dekódolás 
során ezek törléses hibáknak tekinthetőek, és ennek megelelően javíthatóak. A 
gyakorlati dekódolási eljárások során azonban a törölt biteket a vevőben leggyak- 
rabban nullákkal helyettesítjük. 


4.22. példa. A 4.35. ábrán egy standard turbó kódoló struktúrája látható. A két 
komponenskód azonos, a 4.21. példa 1/2 sebességű rekurzív szisztematikus kon- 
volúciós kódja. Mivel a két kódban a szisztematikus rész a sorrendtől eltekintve 
azonos (hiszen a bemeneti bitsorozatot a 2. kódoló számára permutáltuk), ezt csak 
egyszer továbbítjuk: így összességében egy 1/3 sebességű kódhoz jutunk (bizo- 
nyos paritásbitek törlésével a jelsebesség tetszőlegesen megközelítheti az 1-et). 


A továbbiakban ezen a példán magyarázzuk el a turbó kódok működését; en- 
nek általánosítása több illetve más típusú komponenskódokra nem okozhat prob- 
lémát. Először is fontos megjegyezni, hogy bár a turbó kódok magját konvolúciós 
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4.35. ábra. Turbó kódoló. 


kódolók alkotják, ezek a kódok ténylegesen blokk-kódok, ahol egy blokk mérete 
a bitkeverő hossza. Mind a kódolást, mind a dekódolást blokkonként külön vé- 
gezzük el. A blokkméretet a továbbiakban K-val jelöljük, tipikus értéke 219. 215 
között van. 


Az érkező d, d2 , . . . dg adatsorozatot közvetlenül továbbítjuk a kimenetre, 
így kapjuk az xx, fi xb) sorozatot (az s felső index a szisztematikus szóra 
utal). Az első komponens kódoló a d! , d2 , . . . , e bemenetre az xtP ,xWp, $4 xb 


paritásbit-sorozatot generálja. A második kódoló bemenetére azonban — a bit- 
keverő közbeiktatása miatt — az eredeti adatsorozat egy permutált változata, a 
d), d5, . . . , dg sorozat kerül, és ehhez generálja a második kódoló az xiP?) ,x4P2), BE 
xP2) paritásbit-sorozatot. Így végül a csatornába az x xbP 1) ,xiP 2) 8) , xi 1) ,xbP 2). 
. xx , x(p2) bitsorozat kerül. Törlés alkalmazása esetén a paritásbit-soro- 


zatok előre meghatározott elemei nem kerülnek továbbításra. 


A dekódolás megkönnyítése érdekében az első komponenskódolót blokk-kó- 
dolás üzemmódban használjuk; visszacsatolt konvolúciós kódolók esetén is el- 
érhető, hogy a kódolót tetszőleges állapotból elindítva m új bit beléptetésével a 
kódoló a 0 állapotba kerüljön. A különbség csupán annyi, hogy míg az előrecsa- 
tolt esetben ez mindig m darab 0 beléptetésével történt, addig a 4.22. példában 
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ehhez a 0110 állapotból kiindulva rendre a 0, 0, 1, 0 karaktereket kell a bemenetre 
adni. Mivel a két kódoló párhuzamosan működik, általában nem érhető el, hogy a 
második kódoló is egy előre meghatározott állapotban álljon meg. 

A kódoló utolsó — eddig még nem vizsgált — komponenese a bitkeverő. A 
hagyományosan használatos strukturált bitkeverőkkel ellentétben (ilyen például a 
blokk-bitkeverő, amikor egy négyzetes mátrixba sorfolytonosan írjuk az adatokat 
és oszlopfolytonosan olvassuk ki) a turbó kódok esetében fontos, hogy a permu- 
táció minden látható struktúrát nélkülözzön: ez biztosítja, hogy a kód a csatorna- 
kódolási tétel bizonyítása során megismert nagy blokkhosszú véletlen kód jellegű 
legyen. Ezért leggyakrabban álvéletlen bitkeverőket használnak. 








A turbó kódok dekódolása 


A bitkeverő jelenléte miatt a turbó kódok ML dekódolása praktikus (nagy) 
blokkhosszak esetén gyakorlatilag megvalósíthatatlan a nagy komplexitásból adó- 
dó számítási kapacitásigény miatt, ezért a dekódolás során egy szuboptimális ite- 
ratív eljárást, a BCJR algoritmust szokás alkalmazni (léteznek más dekódolási 
módszerek is, illetve az itt bemutatott módszer javított változatai, melyekre itt 
nem térünk ki). Az eljárás lényegét Bahl, Cocke, Jelinek és Raviv dolgozták ki 
1974-ben [5], és a turbó kódok megjelenésével kis módosítással újra az érdeklő- 
dés középpontjába került. Az iterációs lépések során a dekódoló az egyes bitek 
eloszlására becslést ad, és a következő iterációban a dekódolást ezen a priori el- 
oszlást feltételezve végezzük el. Egy iteráció két lépésből áll, melynek során 
előbb az első, majd a második komponenskód dekódolását végezzük el, a dekó- 
dolt eloszlást a fentiek szerint továbbadva az első dekóderből a másodiknak, majd 
a másodikból az elsőnek, és így tovább. 


A dekóder blokkdiagrammját a 4.36. ábra mutatja, ahol yt yi 1!) yi 2) a csa- 


torna kimenetén az xW st 1) sát 2) bementek hatására megjelenő bitek, L1e(d:) és 


L2e(d:) az egyes komponenskódok dekódolása során nyert ún. külső információ, 
melyet a dekódolás következő lépésében a priori információként használunk fel. 


P-t 4 


Figyeljük meg, hogyan biztosítja a bitek megfelelő sorrendjét az első és második 
dekóder között lévő bitkeverő illetve a második és első dekóder között elhelyez- 
kedő bitvisszakeverő, amely az előző bitkeverő inverz leképzését valósítja meg, 


azaz a permutált bitsorozatot visszaállítja az eredeti sorrendbe. 





A dekódolás során először az y), yP ) értékek és az Lo. (d) — log 54, 5] a 
priori információ alapján (/ — I, . . . , K) egy új L1e(d) becslést készít a log BELO] 


(5) 


kifejezésre. A 2. dekóder ezt az információt, a megfelelő sorrendbe rakott yj 


szisztematikus biteket és az yVP 2) paritásbiteket felhasználva új L2e(d:) becslést 
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4.36. ábra. A turbó dekóder blokkdiagrammja. 





a priori je vő külső 
bitvisszakeverő [- 
































a külső , d, a priori 
—r 1. dekóder F—F——— ei bitkeverő [/——— ee 





2. dekóder 





























4.37. ábra. Információáramlás a két dekóder között. 


készít. Az eljárást addig ismételjük, amíg az Lie(d:) és L2e(d1) értékek csak ki- 
csit változnak meg. (Másik lehetséges megállási feltétel, ha az iterációk számát 
előre rögzítjük.) A dekóderek közötti információáramlást jól szemlélteti a 4.37. 
ábra. Ezután a 2. dekóder az L1e(d/) apriori információt feltételezve kiszámítja a 
tényleges 


P(d; rez 1] ,ylP2 1 E 1,...,K) 


A(d:) — log 5 
P(di - oj" aa S1..:. KT 





értéket. Ha A(d!) 5 0, akkor értelemszerűen d, — 1-re döntünk, egyébként d; — 0- 
ra. (A A(d,) és L2e(d!) közötti különbségre itt nem térünk ki. Az eltérés célja az 
iteratív dekódolás stabilitásának biztosítása.) 
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A turbó kódok teljesítményanalízise 


Ebben a részben megmutatjuk, hogyan lehet egyszerűen becsülni a turbó kó- 
dok ML dekódolásának hibavalószínűségét, és hogy milyen jellegű teljesítmény- 
görbét várhatunk el a turbó kódoktól. Mivel a Gauss-csatorna gyakorlati szem- 
pontból sokkal fontosabb a bináris csatornáknál, ebben a részben erre koncentrá- 
lunk. 

A bithibavalószínűség vizsgálatakor a konvolúciós kódoknál már megismert 
unió-korlátot fogjuk alkalmazni. Mivel a turbó kódok lineáris kódok, a korábban 
megszokottak szerint azt feltételezzük, hogy a csupa 0 üzenetet küldtük át, és eh- 
hez vizsgáljuk a hibázás valószínűségét. A bithiba valószínűség abban az esetben, 
ha az n-edik kódszóra döntünk a 0 helyett 


Po(n 10) — wa/K Pe pára; 
ahol w, az n-edik kódszóhoz tartozó nem 0 üzenetbitek száma, azaz az n-edik 
kódszó üzenetsúlya, Pe párn pedig annak a valószínűsége, hogy az n-edik kódszóra 


hibázunk. Ha az n-edik kódszó súlya dn, akkor — a Viterbi-dekódolásnál látottak 
alapján — p paraméterű bináris szimmetrikus csatorna esetén (p  1/2) 


P. párn S (2 p(i — pp)", 


Gauss-csatorna esetén pedig megmutatható [19], hogy 


! 2dnRcE 
P. párn -0 ( FT ) , 


ahol 0(x) — $(—x) a standard normális eloszlás farokeloszlása, R. a kód sebes- 
sége, E, az egy információs bit átviteléhez felhasznált energia, No /2 pedig a csa- 
torna kétoldali spektrális sűrűségfüggvénye (az E, /No értéket jel—zaj viszonynak 
nevezik). Ekkor a bithibavalószínűség 





P, Ca  P,(valamilyen n-re hibázunk) 


2K 
É ké p(1—p))" BSC 
2. EPRHIOZA te (4.68) 
n7 Wn 2dnRCE. 
1 PA Ta ( / tdrtet ) Gauss 


csatorna esetén. 
Jelöljük a d súlyú kódszavak számát Mg-vel, és az ilyen kódszavak üzenetsú- 
lyának összegét Wg-vel. Definiáljuk a kódszavankénti átlagos üzenetsúlyt a kö- 


vetkező módon: 
Wg 
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Mivel egy K hosszú bemenet K/R. hosszú kimenetet eredményez, ekkor Gauss 
csatorna esetén a bithibavalószínűségre vonatkozó felső korlát a következő for- 
mában írható: 








Ke Mag 2dR.E 
Pp N 
d—-drfree 0 
M freeW free 2d freeRcEp 
Ez ES 4.69 
K 0( NM ; (4.69) 


ahol d rree a turbó kód minimális vagy más néven szabad távolsága, M free a mi- 
nimális súlyú kódszavak száma, ÉS W free ezek átlagos információs súlya. Mivel a 
normális eloszlás farokeloszlása igen gyorsan csökken, a képletbeli közelítés nagy 
Ep/No érték esetén (azaz kis zajú csatornán) igen pontos. Az így kapott közelítést 
szokás szabad távolság aszimptotának is nevezni. 


4.23. példa. A 4.22. példában megfelelő bitkeverőt alkalmazva K — 65536 esetén 
d free - 6, W free -z 2, M free kzt 3 adódik. 


A turbó kódok esetében a szabad távolság általában elég kicsi. Azonban kis 
jel—zaj viszony és nagy K esetén a minimális súlyú kódszavak száma jobban be- 
folyásolja a teljesítményt, mint a minimális kódtávolság. Pontosan ez jellemzi a 


4 P, 
1091 
107! 4--- e 
10721 k 
10732 , 
10744 § 
10754. se 
10-61. FESS geg ői SE la a 
10772 


10786 Ama hah aa a 
0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 1.6 1.8 Es/No dB] 








4.38. ábra. A dekódolás hibavalószínűsége és a szabad távolság aszimptota a 4.22. 
példa esetén Gauss csatornán; álvéletlen bitkeverő, K — 65536, R, — 1/2 . 
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turbó kódokat: igaz ugyan, hogy a minimális kódtávolság kicsi, ám a viszonylag 
kis súlyú kódszavak száma nagyságrendekkel kisebb lehet, mint a hagyományos 
hibavédő kódok esetén, amelyek a minimális távolság maximalizálására töreked- 
nek (lásd a 4.23. példát). Ily módon a turbó kódok távolságprofilja sokkal jobban 
hasonlít az , optimális" véletlen csatornakódok távolságprofiljára. Ennek követ- 
keztében a turbó kódok igen jól viselkednek nagyon zajos csatorna esetében, ám 
ahogy a jel—zaj viszony nő, a hibavalószínűség-görbe hirtelen ellaposodik, és a kis 
minimális távolság miatt nagy jel—zaj viszony esetén már nagyobb hibát kapunk, 
mint mondjuk egy jól választott hasonló komplexitású konvolúciós kód esetén 
(lásd 4.38. ábra). 


4.19.  Kódok konstrukciója többszörös hozzáférésű 
kódosztásos csatornákhoz (CDMA) 


Tegyük fel, hogy T számú potenciális felhasználó egy közös digitális csatornán 
kíván kommunikálni. A rendszerben maximálisan M felhasználó lehet egyszerre 
aktív. Az éppen aktív felhasználók halmaza a potenciális felhasználók halmazá- 
nak egy véletlen részhalmaza. Általános esetben egy éppen aktivizálódó felhasz- 
náló tetszőleges időpillanatban léphet a csatornába, azaz nem tételezhetünk fel 
időkoordinációt a különböző felhasználók között. Hasonlóan nincs frekvencia- 
koordináció sem, azaz a teljes rendelkezésre álló sávszélességet használhatják a 
felhasználók. Következésképp az aktív felhasználók jelei ütközhetnek a csatorná- 
ban, amely az átvitt üzenetek — legalábbis részbeni — sérülését okozza. 

A klasszikus többhozzáféréses esetekben idő- vagy frekvenciaosztást alkal- 
maznak, s így ortogonális részcsatornákra bontják (időben illetve frekvenciában) 
a közös csatornát. A mi esetünkben egy más , dimenzióban" végezzük el a kü- 
lönböző felhasználók egyidejű üzeneteinek , ortogonalizálását". A módszer a 
kódosztás alkalmazása. Az egyes felhasználóknak saját kódot adunk, amelyek- 
kel megkülönböztetjük őket egymástól. Nyilvánvaló, hogy a kódokat nem lehet 
akárhogyan megválasztani. A kódokra , ültetett" üzenetek, amelyek az egyes fel- 
használóktól érkeznek, ütköznek a csatornában (pl. összeadódnak), így a venni 
kívánt üzenet hasonló struktúrájú jelekkel keveredve (ún. rendszerzajjal) érkezik 
a vevőbe. A többhozzáféréses kódosztásos rendszerben a kódolás célja eltérő a 
klasszikus esetekhez képest, ahol elsősorban hibakontroll (javítás, detekció) cél- 
jából alkalmaztunk kódolást. A mostani esetben a kódolással címzést is végzünk, 
azaz megjelöljük vele azt a felhasználót, aki az üzenetet küldi. Más szemszögből 
nézve viszont, az adott esetben is zajjal, a rendszerzajjal szemben kívánjuk védeni 
az üzenetet, ilyen értelemben a kódválasztás (adott M felhasználószám mellett) az 
üzenetek detektálási hibavalószínűségét befolyásolja. A kódszóválasztás módját 
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azonban nem csak a megkívánt detektálási hibavalószínűség szabja meg, hanem 
egy legalább ilyen fontos kritérium, a megfelelő szinkronizálhatóság. Említettük, 
hogy az egyes felhasználók időben függetlenül kezdhetnek kommunikálni, így a 
vevő első feladata — digitális összeköttetésről lévén szó — bizonyos szinkroniz- 
mus (a kódszószinkron) megteremtése önmaga és adója között. E kettős követel- 
ménynek egyféle ciklikusan ortogonalitást mutató kódszóhalmaz — a multiple- 
xáló kódszavak halmazának (7 kódszó) — kiválasztása tehet eleget. 

A "90-es évek kezdetére számos jelentős polgári kommunikációs alkalmazás- 
ban is megjelentek a kódosztásos többszörös hozzáférésű (CDMA, Code Divi- 
sion Multiple Access) rendszerek (lásd pl. [46]). A közvetlen sorozatú (Direct 
Seguence, DS), a lassú vagy gyors frekvenciaugratásos (Freguency Hopping, 
FH), valamint az időugratásos (Time Hopping, TH) rendszerek képezik a CDMA 
rendszerek alaptípusait. A CDMA lényege az, hogy nem tételezi fel az idő- vagy 
frekvenciatartomány központi szinkronizálását (egy központot). 

Lassú frekvenciaugratásos (SFH) többszörös hozzáférésű rendszer példáját te- 
kintve a kód 7 kódszót — itteni terminológiában frekvenciaugratás-sorozatot — 
tartalmaz. Minden felhasználó számára kiosztunk egy frekvenciaugratás-soroza- 
tot. A felhasználható frekvenciák száma g, ahol tipikusan T 5 ag. Feltételezzük, 
hogy az aktív felhasználók információs egységeiket (csomag) ezen sorozatok- 
nak megfelelő frekvenciákon továbbítják. Tegyük fel, hogy az aktív felhasználók 
ugratássorozat-aszinkronok, de csomag-szinkronok, azaz ha egynél több felhasz- 
náló ad azonos időszeletben azonos frekvencián, akkor az ütköző csomagok teljes 
hosszban ütköznek, s egymást , megsemmisíthetik". Ezt szemlélteti a 4.39. ábra 
M — 2 esetre, ahol a t-edik időszeletben a 2. frekvencián állt elő ütközés. 

Lassú frekvenciaugratásos többszörös hozzáférésre példa a GSM, ahol a bá- 
zisállomás a híváskor kioszt egy ugrássorozatot. 

Minimalizálni kell az elkerülhetetlen csatornabeli ütközések hatását, s ehhez 
az ütközések számát minimalizáló, T elemű ugratássorozat-halmazt generálunk. 
Ennek elemeit osztjuk ki egy-egy felhasználónak. Jelölje C" az n hosszúságú, F 
ábécé feletti multiplexáló kódszavak halmazát: 


L égjáa hd zge b, c0 eF". 


A C" kód tehát a többszörös hozzáférésű kódolást végzi, vagy másképp kife- 
jezve a multiplexálást. A multiplexáló kód a , hátán" hordozza az üzenetcsoma- 
gokat, amely csomagok minimális számban történő sérülését kívánja a kódolás 
garantálni az aszinkron többszörös hozzáférésű csatornán való továbbításukkor. 
Egy további kódolást, törlés- illetve hibajavító kódolást is alkalmazva, lehetőség 
van arra, hogy a mégis megsérült csomagokat kijavíthassuk a vevőben. A feladat 
ebben a megközelítésben tehát alapvetően a C" kód tervezése, mivel a hibakontroll 


4.19. CDMA 283 


frekvencia 








V Vt 
[/ HL 





















































: e nlss ke t ső idő 


4.39. ábra. Ütközéses FH csatorna. 


kódolás fázis klasszikus, ismert lépés. 

A C" kód hatékonyságát kódszavai ciklikus távolságának minimumával mér- 
jük, amit kódosztásos rendszertervezői szótárból származó ekvivalens korrelációs 
fogalmakkal is leírhatunk. E célból ciklikus auto- valamint keresztkorrelációs 
mennyiségeket vezetünk be: 


n—-1 


2. f(Cr, Cr) 


Aa — max max 
ceC" 0x1an 








a C" kód autokorrelációs paramétere, valamint 


n—-1 


2 f(er.€r4) 


hc — max max 
c ceECTO0£LTAN 


ce 
a C" kód keresztkorrelációs paramétere, ahol az indexbeli összeadás modulo n 
értendő. Az f leképezés választása az F karakterábécétől függően a következő a 
tipikus rendszerekben: bináris DS rendszerekben, amikor F — (--1,—1]): 


f(u,v) Hy; 


ahol u,v c (1,—1), a szokásos skalárszorzás korrelációt kapjuk, ha pedig F — 
(1,2,...,ab. 4-áris ábécé, akkor az 








1, hau—v 
11601 hee ( 0, egyébként 
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definícióval a Hamming-korrelációt kapjuk. Két n karakter hosszú sorozat közti 
Hamming-korreláció azon karakterpozíciók darabszáma, amelyben a két sorozat 
azonos karaktereket tartalmaz (azaz a Hamming-távolság , komplemense"). FH 
rendszerekben g - 2. 

A C" kód konstruálása során a 


MNmax — max (Aa, hc) 


értéket szeretnénk minél kisebbre beállítani. 

Rendszertervezői szemszögből tekintve kicsi Ax érték azért szükséges, hogy 
minimalizáljuk a különböző aktív felhasználók csatornabeli jelei közti interferen- 
ciát (rendszerzaj). Hasonlóan a kis Ay értékre törekvés a vevő kódszinkronizációs 
képességeit kívánja növelni. A Amax paraméter minimalizálása szimultán szeretné 
optimalizálni a Ax és A értékeket. 

Eddigi jelöléseinknek megfelelően 


(nT Amax.F) 


paraméternégyessel jellemezhetjük a C" kódot, ahol T — IC"]. Két kód egybeve- 
tését azonos n szóhossz és F ábécé mellett a 7 potenciális felhasználószám és a 
MNmax korrelációs paraméter alapján végezhetjük. Ha csak F rögzített, akkor a T és 


Amax szóhosszra vett relatív paraméterértékeket vethetjük egybe. 





4.24. példa. Tegyük fel, hogy g különböző frekvencia áll rendelkezésre, és csa- 
torna időszeletenként bármelyiket választhatjuk a csatornába adott jel számára, 
tehát g-FSK modulációt végezhetünk. Ez azt jelenti, hogy nembináris kódolást 
alkalmazva GE(g) felett dolgozhatunk a csatornakód elkészítésekor, ahol g vala- 
mely prímszám vagy prímhatvány. 

Minden forrásnak két különböző típusú információt kell a csatornába juttatnia. 
Az egyik a forrás (felhasználó) azonosítója (címe), a másik az üzenet. 

Ezen információk kódolásának egyik módja az alábbi. A forrás bináris soro- 
zatából képezzünk a-szintű karaktersorozatot, s egy kódszóba kódolandó üzenet 
legyen egy karakter, azaz GF(g) egy eleme. Egy megfelelő kód ezen üzenet kó- 
dolására egy (g — 1, 1) paraméterű GEH(g) feletti RS-kód. Ekkorad—n-—k-i-1 
összefüggés alapján d — g— 1 adódik a minimális kódszótávolságra, azaz tetsző- 
legesen kiválasztott két kódszó minden koordinátában különbözik egymástól. A 
kód generátorpolinomja lehet a 


869) —(x—1)(x— 0) (x— 01), 
ahol a. a GF(g) primitív eleme. Könnyen belátható az 


(x— age) — ax —1 
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felhasználásával, hogy 





£(x) —xT? har xT garat gp... Fox, 


ha g — 2! alakú. Így a kódszavakat az (1,047?, 0475, . . . o) vagy — ekvivalens 
kódot használva — az A — (1, c, 02, . . . , 017?) GF(g) feletti vektornak az üzenet- 
tel (GF(g) elemmel) történő szorzása generálja. A különböző üzenetekhez rendelt 
kódszavak az A vektor elemeinek ciklikus eltolásával generálhatók. Innen is lát- 
ható, hogy a kódszavak egymástól azonos, g— 1 távolságra vannak. 

Ennél a fajta kódolásnál minden felhasználó azonos kódot használ az üzene- 
tek kódolására, tehát ez multiplexálásra nem jó. Egy újabb kódolással a forrás 
azonosítójával is megjelöljük az egyes források fenti módon kódolt üzeneteit. 


Használjuk az i-edik forrás azonosítójául az 


n £ g— 1 hosszú vektort, i — 1, 2, . . .  g— 1, és az azonosítónak az üzenetkódszóra 


történő , rákódolását" a 
cb) — BA ai! 1 (4.70) 


formula felhasználásával végezzük, ahol B c GF(g) a pillanatnyi üzenet. Maximá- 
lisan g — 1 felhasználó lehet egy rendszerben, hiszen ennyi azonosítót oszthatunk 
ki. A rendszerben kódszószinkront feltételezve az i- illetve j-edik felhasználó 
c(B) illetve c kódszavai legfeljebb egy koordinátájukon egyezhetnek meg, 
azaz a különböző felhasználók kódszavainak minimális távolsága g — 2. Aszink- 
ron esetben, amikor a kódszavak átfedésben vannak, a cB) kódszó a vele átfedődő 
cím és eV) kódszófelekkel összesen legfeljebb két koordinátáján ütközhet. 

A kódszavak ábrázolására idő x frekvencia mátrix használatos, amely egy 
(g — 1,ag) méretű bináris mátrix az adott esetben, s azon eleme 1 értékű, amely 
koordinátáknak megfelelő cellát átvitelre felhasználunk. 

Általában nem küldik át a teljes kódszót, hanem néhány koordinátát törölve 
rövidítik azt. A cüP) kódszó kifejezését tekintve, láthatóan nem vesztünk infor- 
mációt az (oi7-! , B)-ra nézve ezzel a rövidítéssel. A kódszó rövidítésével viszont 
csökkentjük a többi forrás kódszavai okozta rendszerzajtól való megkülönböz- 
tethetőségét. Adott bit/sec sebességű forrás csatornakódolása ilyen kis sebes- 
ségű kóddal, a frekvenciatartományban nagy sávszélességnövelést jelent. (Emiatt 
ezen kódosztásos rendszerekre a szórt spektrumú (spread-spectrum) elnevezést 
is használják.) 

A fentiekben leírt kódolásra vegyünk egy kisméretű illusztratív számpéldát, 
ahol legyen g — 8. Legyen a e GF(8) a primitív elem, amelyre 0? -Fo--1 — 0. 
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Alkalmazzuk az i 6 ai-! megfeleltetést a nemzérus testelemekre, ekkor (4.70) 
alapján a 3 karakterrel rövidített kódszavak a következők: 


(0,0,0,0) (1,2,3,4) (2,3,4,5) (3,4,5,6) 


(4,5,6,7) (5,6,7,1) (6,7,1,2) (7,1,2,3) 
Például, ha a harmadik forrás az 5 üzenetet kívánja átvinni, akkor a 
eses ő LIE SZ JE 417) 


kódszót küldi el. 

A dekódolás a kódolás inverz művelete. Helyezzük el a források pillanat- 
nyilag küldött kódszavait az idő x frekvencia mátrixba. Legyen pl. M — 3 és 
c(1.2) — (4,7,2,6), e) — (6,4,0,5), e8.5) — (2,4,1,7) az egyes kódszavak, ek- 
kor a dekódolás inputja az alábbi bináris vett mátrix: 


frekvencia I 


7 0101 
6 100 1 
5 0001 
4 1 100 
5) 0000 
2 1010 
1 0010 
0 0010 

0123 


idő 


Az idő x frekvencia mátrix nemzérus elemeit oszlopaikon belül permutáljuk. 
Először a nemzérus elemek sorindexéből (mint GF(8) testelemből) kivonjuk a de- 
kódolni kívánt üzenet forrásának azonosítóját, majd az eredményül kapott mátrix 
nemzérus elemeinek sorindexét oszloponként, rendre az 1, 07! , 072, . . . , o (a—J—2) 
elemekkel szorozzuk. Ezen műveletekkel valóban a kódolás inverzét végeztük el. 
A műveletek eredményeképpen kapott mátrix azon sorában, amely a venni kívánt 
felhasználó pillanatnyi B üzenetének felel meg, csupa 1 áll. 





Számpéldánkat folytatva az idő x frekvencia mátrix a dekódolás során az 
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alábbi alakra transzformálódik az első felhasználó üzenetének dekódolása során: 


7 0000 
6 0010 
5 1000 
4 1000 
3 0001 
2 1111 
1 0101 
0 0010 

0 123 


Valóban (1,1,1,1) áll a 2. sorban, amely a B — a üzenetnek felel meg. A 
dekóder feladata tehát megállapítani, hogy melyik sor tartalmaz csupa 1-est. 

Mivel egyszerre több felhasználó is küld a csatornába, ezért előfordulhat, hogy 
egynél több sor is csupa 1-esből áll, s ekkor a dekódoló véletlenszerű választásra 
van utalva ezen sorok között, azaz dekódolási hiba keletkezhet. Mivel az adott 
kódolásnál a különböző felhasználók kódszavai a mátrix egy adott sorába csak 
egy 1-est adhatnak, ezért u karakteres rövidítés esetén ha M £ g — u — 2, akkor 
hibamentes átvitel biztosítható elvileg. Számpéldánkban ez az M £ 3 feltételt 
jelenti. 

Példánkban kódszószinkron esetet tekintettünk hallgatólagosan, míg a gya- 
korlati eset a kódszavak aszinkronizmusa. A fenti kódkonstrukció ebben az eset- 
ben is jól használható, de aszinkronizmus esetén növekszik a kódszótévesztés va- 
lószínűsége a kódszóátlapolódás miatt. 


Celluláris mobilis CDMA rádiótelefónia példája 


Az IS-95 CDMA rendszer: 
A CDMA elvének legkiteljesedettebb polgári alkalmazását jelenti a celluláris mo- 
bilis CDMA rádiótelefónia. A CDMA megoldás igazi előnyei celluláris rádiótele- 
fónia alkalmazásban a hálózati funkciók alaposabb tanulmányozása és megértése 
kapcsán derülnek ki, amelynek részleteire (helyszűke miatt) itt nem tudunk ki- 
térni. A fizikai szintű vonatkozások, mint a moduláció, kódolás, szinkronizáció, 
megoldásaik paraméter-értékeiben ugyan lehetnek speciálisak a CDMA rendsze- 
rekben, de alapvetően nem különülnek el a vezetéknélküli digitális kommuniká- 
ciós rendszerek alapvető problémáitól, megoldásaitól. 

Ugyanakkor a celluláris CDMA hálózati szintű koncepciójának alapvető spe- 
ciális elemei vannak, s nagyrészt ezeken múlik a celluláris CDMA jelentős kapa- 


288 4. HIBAJAVÍTÓ KÓDOLÁS 














konvolúciós Walsh-Hadamard- PN2 PNI 
Pi 
kódoló kódolás kódolás kódolás 






































4.40. ábra. A celluláris CDMA kódolás tömbvázlata. 


citáselőnye a konvencionális rendszerekhez képest. 
A celluláris CDMA összetett és hatékony kódolási rendszere egyidejűleg meg- 
oldja a 
a) különböző egyidejű, azonos frekvenciasávban kommunikáló jelek kódolás- 


4 


sal történő multiplexálását (CDMA), 


4 


b) a zajos, fadinges (véletlenszerű jelcsillapodásos) csatornán történő átvitel 
minőségét biztosító hibakontroll kódolást, 


c) privát (kommerciális szinten védett) kommunikáció biztosítását. 


A CDMA CAI [1] specifikálja a CDMA jelalakok tervezését, köztük a frek- 
venciaosztást, az álvéletlen sorozatokkal történő kódosztást, és az ortogonális jel- 
multiplexálási technikát. 

A mobil — bázisállomás (uplink) és a bázisállomás — mobil (downlink) 
csatornában hasonló jelképzési elvek érvényesülnek. Vannak azonban rendszer- 
technikai különbségek, ezért a jelképzés tömbvázlat jellegű áttekintését külön vé- 
gezzük a két kommunikációs irányra. 

Bázisállomás —; mobil csatorna: 


A kódolási rendszer elemei: 

e konvolúciós kódoló (hibajavítás) 

e Walsh-Hadamard-kódolás (multiplexálás egy szektoron belül) 

e PN2 kódolás (privát kommunikáció) 

e PNI kódolás (multiplexálás különböző szektorok, cellák között) 


A tömbvázlatot a 4.40. ábrán láthatjuk. Egy cella egy szektrorán belüli aktív 
mobilok megkülönböztetése (jeleik kódmultiplexálása) bináris ortogonális kódok 
(Walsh-Hadamard-kód) alkalmazásával történik. A tipikus kódszóhossz 64, az 
ortogonális kódszavak száma 64. Ezzel 64 csatorna képezhető egy szektoron be- 
lül, amelyből egy a pilotcsatorna (jelzésátvitel) céljára van lefoglalva. 

A koherensen (azaz vivőfázis-helyesen), kódszinkronban működő egy szek- 
toron belüli downlink jeleket az ortogonális kódok alkalmazása hatékonyan sze- 
parálja. 


4.19. CDMA 289 





















































downlink CDMA csatorna 
pilot forgalmi ! ] forgalmi e forgalmi ! ] forgalmi 
csatorna Í ] csatorna ) ] csatorna csatorna ] ] csatorna 
0 1 2 s 62 63 
teljesítmény 
adat szabályozás 











4.41. ábra. Ortogonális kódmultiplexálásos csatornaképzés a downlink csatorná- 
ban. 


A k paraméterű Walsh-Hadamard-kód kódszavainak halmaza a 2.5. sza- 
kaszban már megismert egyszerű rekurzív konstrukcióval állítható elő. A generált 
C(2" k,27!) kód szavait az Axx mátrix soraiból képezik. Illusztráció kedvéért az 
alábbiakban megadjuk a 8 elemű Walsh-Hadamard-kód elemeit (3-1 amplitúdó 
3 0 bit, —1 amplitúdó — 1 bit a megfeltetés): 


1 2 3 4 5 6 7 8 








1 1 1 1 1 1 1 1. kódszó 
1 —-I1 1 —-I 1 —-I1 1 —-I 2. kódszó 
1 1.—L -1 1 1 —1 -I1 3. kódszó 
I El 51 1 1 —-1 -I1 1 4. kódszó 
1 1 1 1 1 1 1 1 5. kódszó 
1 —-I1 1 —1 -I 1 —-I1 1 6. kódszó 
1 1 1 1 1 1 1 1 7. kódszó 
1 —1 -I1 l —-I1 1 1 —-I1 8. kódszó 


Bármely két kódszó skaláris szorzata zérust eredményez, mivel fele koordiná- 
tán egyező, felén ellenkező előjelűek az elemek. 

Álvéletlen (pszeudorandom, PN1) sorozatokkal történő kódolás segítségével 
különböztetik meg a különböző szektorok és cellák mobiljainak jeleit a down- 
link csatornában, azaz ezen az úton történik a többhozzáféréses fázisugratásos 
kódmultiplexálás. A Walsh-Hadamard-kód fizikai sebessége megegyezik az úgy- 
nevezett chip-sebességgel, azaz a PN1 kódolás ütemének megfelelő. 
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A különböző cellák és szektorok saját PN1 kódjai egy alapkódfázis különböző 
időtolásaival állnak elő, míg egy cella egy szektorában az összes aktív mobil PN1 
kódja azonos időfázisú. Az időtolás megoldásnak a működőképessége a PN1 kó- 
dok autokorrelációs tulajdonságán alapszik, miszerint ha az időtolás az alapkód 
két származtatottja között legalább egy chip-idő (chip — elemi jel, a PN1 kód egy 
eleme), akkor elegendő hosszú időablakban korrelációt képezve, a korreláció ér- 
téke az időablak hosszával a zérushoz tart. 


A PNI kódokat lineárisan visszacsatolt shiftregiszteres (LFSR) generátorok- 
kal állítják elő. A generált sorozat periódushossza 32768 chip-idő. A PNI chip- 
sebesség 1.2288 MHz, amivel pontosan 128 chip esik a 9600 bit/s sebességű for- 
rás minden bitjére. A kvadratúra moduláció két ágán két különböző generátorú 
PN sorozatokkal kódolnak, azaz négyfázisú PN1 modulációt alkalmaznak. 


A rendszer használ egy igen nagy periódusú (periódushossz — 292 — 1) PN2 so- 
rozatot is, amelyet mobilcímhez választott egyedi fázistolással rendelnek az egyes 
felhasználókhoz. Mivel minden egyes eltoláshoz egy cím tartozhat, ez igen nagy 
felhasználószám melletti megkülönböztetést tesz lehetővé. A chip-sebességgel 
futó PN2 sorozat chip-időbeli XOR-ral one-time-pad jellegű, kommerciális kö- 
rülmények közötti bizalmasító (confidential) mértékű védelmet nyújt. 


A downlink jelalaktervezés nagyban támaszkodik a bázisállomástól sugárzott 
pilotjel jelenlétére, ami lehetővé teszi a koherens vételt. A viszonylag nagyszintű 
pilotjel igen pontos követést tesz lehetővé a mobilok szinkronizáló egységei szá- 
mára. A pilot csatornabeli jelképzés módja olyan, mintha egy külön adatcsa- 
torna lenne, amelyben csupa 0 , adat" kerül továbbításra, azaz csupa 0 Walsh— 
Hadamard-kódszó (64 db 1) ismétlése , ül" a PN1 kód kvadratúra párján. 


A mobil szinkronizál a PNI kódra, keresve azt a fázishelyzetet, ahol a maxi- 
mális autokorreláció adódik a vett és az általa generált sorozat között. Végigkeresi 
a teljes periódust (32768 chip), s a legerősebb autokorrelációs értéknek megfelelő 
fázishoz tartozó bázisállomást tekinti legközelebbi bázisállomásnak. Miután meg- 
történt ezen szinkronizálás a legközelebbi bázisállomás pilotjele PN1 kódjára, a 
következő lépés a vivőszinkronizálás a pilotjel felhasználásával. Ezen szinkront 
tartva a megfelelő Walsh-Hadamard-kódszó alkalmazásával a forgalmi csatorná- 
kon (max. 63) a mobil alkalmas a PNI -- PN2 -- Walsh-Hadamard-kódolás lefej- 
tése után a hibakontroll konvolúciós kód dekódolására. 

Mobil — bázisállomás csatorna: 

Az uplink csatornában a Walsh-Hadamard-kód alkalmazása másképpen tör- 
ténik, mint a downlink csatornában. Nevezetesen a downlink csatornában a bá- 
zisállomás fixen egy-egy ortogonális csatorna képzéséhez használja fel a 64 kód- 
szóhosszú, 64 kódszóból álló Walsh-Hadamard-kód egy-egy kódszavát, az uplink 
csatornában viszont az üzenetbitek 6 bites csoportjai folyamatosan címzik meg a 
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megfelelő Walsh-Hadamard-kódszót, azaz az nem fix, hanem a bitfolyamtól füg- 
gően változó. A módszer a szuperortogonális konvolúciós kódolás. Úgy is fogal- 
mazhatunk, hogy ezzel 64 szintű ortogonális jelkészletű modulációt valósítunk 
meg. Ezzel a módszerrel egy igen jó minőségű csatorna alakítható ki fadinges kö- 
rülmények között, alacsony jel/zaj viszony mellett anélkül, hogy pilot referencia 
jelre kellene támaszkodni. (Erre a kódolóra a tömbvázlat további elemeinek rövid 
ismertetése után részletesen visszatérünk.) 


Az uplink csatornában ugyancsak alkalmazásra kerülnek a PNI és PN2 álvé- 
letlen kódok. 


A kódolási tömbvázlatunk ezzel még nem teljes, mivel a CDMA kódrendszer 
igen erőteljesen támaszkodik a kódátfűzés alkalmazására is. Ha a vételi jeltel- 
jesítmény időben változik, ezzel együtt változik a demodulátor bemenetén a bit- 
energia, következésképpen a jel/zaj viszony, ezáltal a demodulációs (nyers) bithi- 
baarány is. Javuláshoz vezethet megfelelő diverzity alkalmazása. (Diverzity rend- 
szerben ugyanazt az információt két különböző csatornán viszik át. Működésének 
alapja az, hogy kisebb annak a valószínűsége, hogy egyidejűleg mindkét csatornán 
rossz átviteli függvény alakul ki, mint annak, hogy a kettő közül csak az egyiken.) 
A CDMA rendszerben idődiverzityt valósítanak meg kódáttfűzés felhasználásával. 
Blokkátfűzés esetén ez azt jelenti, hogy I x J méretű blokkba gyűjtjük az együtt 
átfűzendő I: J szimbólumot (chip, bit, szó, stb. egységet), soronként egymásu- 
tán töltve fel a blokkot. Ezután oszloponként olvassuk ki a csatornába a blokk 
elemeit. A vevőben ennek inverzét elvégezve az eredeti sorrendet hozzuk létre. 


Ezáltal a csatornában időben szomszédos szimbólumok az átfűzés visszafej- 
tése után J szimbólumidő távolságra kerülnek. Ennek az a haszna, hogy J szim- 
bólumidőnél kisebb átlagos fadingidőtartamok esetén fadinghatás szempontjából 
független energiákkal kerülnek szomszédságba a szimbólumok, azaz létrejön az 
idődiverzity. 

A 4.42. ábrán látható a K — 9 kényszerhosszú (regiszterhossz -t 1), 5 kód- 
sebességű, 753 és 561 generátorú (oktális ábrázolás), ds — 12 szabad távolságú 
bináris konvolúciós kód generátora, amely a downlink csatorna hibajavító kódo- 
lója. 

A megcsapolások helyeit az oktális ábrázolású Gy — 753 és G2 — 561 generá- 
torok adják. Ez azt jelenti, hogy bináris ábrázolásban 110 101 111 (357) valamint 
100 011 101 (165) 1-eseinek megfelelő pozíciókban csapoljuk meg a léptetőre- 
gisztert. (A rendszerben használatos még 3 sebességű kódoló is, amely d. — 18 
szabad távolságú, K — 9 kényszerhosszú, Gy — 711,G2 — 663, G3 — 557 meg- 
csapolás generátorokkal rendelkezik. Az említett 5) illetve Z sebességű kódok a 
lehető legnagyobb szabad távolsággal rendelkeznek az adott kényszerhossz mel- 
lett.) 
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4.42. ábra. 2 kódsebességű konvolúciós kódoló. 
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4.43. ábra. A szuperortogonális konvolúciós kódoló. 















































A 4.43. ábrán láthatjuk a szuperortogonális konvolúciós kódoló blokkvázla- 
tát. 

Az m bites léptetőregisztert m — 1 belső pontján megcsapoljuk, s ez azm—1 
bites blokk címez meg egy Walsh-Hadamard-kódszót, amelynek kódszóhossza 
2-1. A 4.43. ábrán ezt a kódszókiválasztást végzi az ortogonális blokk-kódoló. 
A szuperortogonális kód tehát egy bináris konvolúciós kód és egy ortogonális 
blokk-kód hibridje. A szuperortogonális konvolúciós kódoló inputján egy bit be- 
lépésekor kiszámítódik a shiftregiszter állapotának megfelelő ortogonális kódszó, 
s ehhez hozzáadódik a bemeneti (b1) és a shiftregiszter aktuális kimeneti (b2 ) bit- 
jének 277! szeres ismétlésével kapott szó, azaz 


kimeneti szó — ortogonális kódszó 9 (bi, bi, . . . b1) E (ba, ba, . . ., b2 ). 


Ha tehát bj - b2, akkor a kimeneten az ortogonális kódszó bitenkénti invertáltja 
jelenik meg. 
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4.44. ábra. A redukált állapotátmenet-gráf. 


A kódoló kicsi sebességű, azaz egy bit belépésekor a kimeneten 277! bites 
szó jelenik meg, R — JAT: 

A szuperortogonális kód figyelemre méltó tulajdonsága egyrészt viszonylag 
könnyű analizálhatósága, másrészt kiváló hatékonysága (mindennek ára a kis se- 
besség). Az ortogonális szavak párjai pontosan fele bitjükben különböznek, te- 
hát a zérus súlyú vektortól pontosan v — 277? bitben különböznek. A redukált 
állapotátmenet-gráf látható a 4.44. ábrán, amely jól követhető a kódoló blokksé- 
mája alapján. A kezdeti és végállapot a regiszter csupa 0 állapotának felel meg 
(hasonlóan ahhoz, ahogy a 4.30. ábra kapcsán eljártunk). A kezdeti állapotból 
egy 1 bit beléptetésével lépünk ki. A kezdeti és végállapot közötti i-edik állapot 
(i — 0,1,...,m — 1) annak felel meg, hogy a regiszterben milyen hosszú csupa 0 
bitből álló sorozat található az input oldali cellákat tekintve. 

A 4.18. példában megismert transzfer függvény számításának egy gyakorlati 
példáját mutatjuk be ennek kapcsán. Az ott megismert jelölésekkel a blokksémá- 
ban a 


wW -D"-D7 E D!/ 89 


jelölést használtuk, továbbá / szorzó azon az élen áll, amely az 1 adatbit kódolóba 
léptetésével generálódott, míg az I szorzó hiánya W előtt azt jelenti, hogy az él 0 
adatbit kódolóba léptetésével generálódott. 

x-gal jelöltük meg a három, külön magyarázatot igénylő élet. Az 1" él 1 adat- 
bit beléptetésekor keletkezik az azelőtt zérus állapotú kódolóban, azaz a zérus 
útból leágazó első él. A kódoló vázlata alapján jól látható, hogy ekkor ennek a 
bitnek a hatásaként a csupa 1 kódszó jelenik meg a kimeneten, azaz amelynek sú- 
lya 2v (— 277!) (a W? jelölés pontosan ezt fejezi ki, mivel W definíciója szerint 
a súly a kitevőben szerepel). Hasonló a magyarázat a 3" él esetén is, csak ott a ha- 


tást a kilépő 1 bit okozza. A 2" él esetén a belépő és kilépő bit I, mod 2 összegük 
0, s az ennek megfelelő csupa 0 szó (v — 0 súlyú szó) jelenik meg a kimeneten. 
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A fenti redukált folyamatgráf alapján felírható transzfer függvény a követ- 


kező: 
IW1t3 


1—I(W 3 W2 7 . . . 4 Wm-2 4.241) 


Innen a bithibaarány összefüggés 


Z(m-3)v 1—77 2 
ipuz (4-227y (; ay ) í 


ahol Z az egy bináris csatornaszimbólum dekódolási hibavalószínűségére vonat- 
kozó Bhattacharyya felső becslés: 





T(W,T) — 


AT (W,T) 
P stkütltltk So Slö JESS 
hőse 








z- f Vpo0)pi0jay. 


Emlékezetnélküli csatorna esetén, ha két csatornabeli szó m csatornabitben kü- 
lönbözik, akkor annak valószínűsége, hogy téves lesz a döntés, 2"7-mel felülről 
becsülhető. Gaussi csatorna esetén 


Z Ge) 
—EXP( —]); 
No 


ahol E, a csatornabitre jutó energia, azaz E, — RE). 


Az UMTS rendszer: 

Az UMTS (Universal Mobile Telecommunications System) a harmadik generá- 
ciós nyilvános mobil távközlő rendszercsalád (IMT2000, International Mobile Te- 
lecommunications) európai tagja [23]. Fontosabb jellemzőit 1998-ra rögzítették, 
és azóta évről évre ún. ReleasseXXXX formában teszik közzé a szabványosítás 
aktuális állapotát. 

Az UTRA (UMTS Terrestrial Radio Interface) az UMTS földfelszíni rádiós 
interfész csatornahozzáférési technológiája a szélessávú DS-CDMA. A rádiós in- 
terfész támogatja mind a frekvenciaosztásos (FDD, Freguency Division Duplex), 
mind az időosztásos (TDD, Time Division Duplex) üzemmódot. FDD esetén a fel- 
használótól a cellaközpont irányában (uplink), illetve a cellaközponttól a felhasz- 
nálók irányában (downlink) a kommunikáció két külön frekvenciasávban folyik. 
TDD esetén azonos frekvenciasávban időben kerül a két irány szétválasztásra. 

A rendszer beszédátvitelt és nagysebességű adatátvitelt biztosít, széles sebes- 
ségtartományban nyújt szolgáltatást a felhasználónak. A felajánlott bitsebessé- 
gek a 16—2048 kbit/sec tartományban 2 hatványainak megfelelő értékek lehetnek. 
Különböző szolgáltatási minőségeket (OoS, Ouality of Service) tud felajánlani a 
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rendszer, mely le kívánja fedni a klasszikus mobil szolgáltatásokat, de az épületen 
belüli adat- és beszédkommunikációt is. Mobil felhasználók esetén a makrocel- 
lában 500 km/h sebességig 144 kbit/sec adatsebességet, mikrocellában 120 km/h 
sebességig 384 kbit/sec adatsebességet, pikocellában 10 km/h sebességig 2048 
kbit/sec adatsebességet tud felajánlani a rendszer. 


Az UMTS kódolási alrendszere komplex és variábilis, igazodik a különböző 
szolgáltatásokhoz (sebesség, 005). Az UMTS rendszerben használt csatornakó- 
dok két alapvető funkciója a többhozzáféréses kódosztásos csatornaképzés illetve 
a , klasszikus" hibakontroll (hibajavítás, hibadetekció) kódolás. Az UMTS kódo- 
lási rendszere sok rokon vonást mutat az IS-95 CDMA rendszerével, de alapve- 
tően annál gazdagabb, részletezőbb a sokféle szolgáltatás kapcsán. 


Hibajavító kódok céljára konvolúciós kódot, Reed-Solomon-kódot, turbó kó- 
dot használnak. A kódok sebessége a szolgáltatáshoz illeszkedően különböző le- 
het. A tipikusan csomós hibájú kommunikációs csatornákon kódátfűzés (inter- 
leaving) alkalmazása alapvető kódkombinációs technika. A különféle átviteli se- 
bességekhez, adott kerethosszak mellett különböző kódsebességek szükségesek. 
A sebességek ezen illesztésének fontos kódmódosító technikája a kódszóbitelha- 
gyás (puncturing). Konvolúciós kódok tipikus paraméterei: R — 1/2,R — 1/3 se- 
bességek, valamint K — 9 kényszerhossz. A beszédcsatorna (általában valósidejű 
vagy interaktív szolgáltatások csatornája) hibajavítása esetén, ahol a késleltetés- 
megszorítás miatt rövidebbek a kódszóhosszak, kevesebb komponens átfűzése 
engedhető csak meg, a szerencsére tipikusan nagyobb megengedhető dekódolási 
bithibaarányok (BER, Bit Error Rate) rovására. Nem valósidejű szolgáltatások 
esetén, mint például adatátvitel, az alacsony dekódolási bithibaarány a kritikus 
szempont, ezért nagyobb kódátfűzés, általában nagyobb blokkméretek, hatéko- 
nyabb javítás alkalmazható. 


Példaként tekintsük egy kissebességű beszédcsatorna, illetve egy nagysebes- 
ségű adatcsatorna hibakontroll kódolásának lépéseit és paramétereit. FDD mód- 
ban az úgynevezett DCH (Dedicated Channel) radio unit előállítása a követke- 
zőképp történik: a 8 kbit/sec sebességű G.729 beszédkódoló 80 bitet állít elő 
10 msec hosszú időkeretben. Ehhez a 80 bithez 16 bit CRC kerül kiszámításra, 
amely kódolási lépés során 96 bites, hibadetekcióra alkamas kódszót nyerünk. Az 
R — 1/3,K — 9 paraméterű konvolúciós kódoló 8 bites shiftregiszterének nullá- 
zása (blokk-kódoló mód) céljára 8 bitet (tail) illesztünk a 96 bites szóhoz, ami- 
vel 104 bites kódolandó üzenet kapunk, majd ennek konvolúciós kódolásával 
3 : 104 — 312 bites kódszóhosszra jutunk. Ezen 312 bites kódszavak kerülhetnek 


ezután átfűzésre. 


TDD módban a 2048 kbit/sec sebességű adatcsatorna hibakontroll kódolá- 
sának lépései a következőe: 10 msec hosszú időkeretben ezen sebesség mellett 
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20480 adatbit keletkezik. R — 200/210 sebessségű Reed-Solomon-kódolással 
20480 - 200/210 — 21504 bites kódszót kapunk. Ehhez X számú jelzésbitet, va- 
lamint 16 - 8 — 128 nullázó bitet (tail) illesztünk, amivel 21504 -- X -- 128 bites 
szót nyerünk. 16 komponensre szétválasztva ezen szót, s R — 2/3 sebességű kon- 
volúciós kódolást alkalmazva (21504 --X -- 128) : 3/2 — 32245 3-3X/2 7- 192 bi- 
tes kószót kapunk. Ebből kódszóbitelhagyás művelettel Burst 1 képzése esetén 
3900 3-3X/2 bitet, Burst 2 képzése esetén 3744 3- 3X/2 bitet elhagyva, kapjuk 
a végső szóhosszakat, amelyek 28548 bit (Burst 1), illetve 28704 bit (Burst 2) 
méretet jelentenek. 


Hasonlóan, mint az IS-95 CDMA esetén, a kódosztásos többhozzáférése csa- 
tornaképzés kódolási eljárásai egyrészt a saját cellából, illetve a környező cel- 
lákból származó egyidejű, azonos idő- és frekvenciacsatornában található inter- 
feráló jelek (MAI, Multiple Access Interference) csillapításra (scrambling co- 
des), másrészt ortogonális csatornák képzésére szolgálnak (channelization codes). 
Az utóbbi, a csatornaképző kódok — az IS-95 CDMA rendszernél elmondottak- 
hoz hasonlóan — Walsh-Hadamard-kódra épülnek, amelyből azonban az UMTS 
esetén ún. Orthogonal Variable Spreading Factor (OVSF) kódcsaládot képeznek. 
Ezen kódokat egy ún. kódfából származtatják, ahol a gyökértől a levelek felé ha- 
ladva egyre hosszabb kódok találhatóak. Jentőségük, hogy nemcsak az azonos, 
hanem a különböző hosszúságú kódok is ortogonálisak egymásra, ezáltal kivá- 
lóan alkalmasak a különböző adatsebességű csatornák megkülönböztetésére, mi- 
közben az eredő bitsebességet konstanssá teszik. 


Downlink irányban pedig az egyazon cellában tartózkodó felhasználók jele- 
inek ortogonalizálása oldható meg OSVF kóddal. Mivel az OSVF kódok hal- 
mazának mérete nagy felhasználói populációkhoz kicsi, ezért azok cellánként új- 
rafelhasználásra kerülnek. Az OSVF kódok kódszószinkron esetén nyújtják az 
ortogonalitás tulajdonságát, aszinkron esetben azonban igen kedvezőtlen a kor- 
relációs viselkedésük. Következésképpen a szomszédos bázisállomások által su- 
gárzott OSVF kódok minden további intézkedés nélkül elviselhetetlen zavarjelet 
generálnának. Megoldásul az IS-95 CDMA PNI! kódjának az itteni terminoló- 
gia szerinti scrambling kódok szolgálnak. Downlink irányban 28! — 1 szóhosszú, 
hosszú Gold-kódok különböző szeleteit osztják ki a különbözo celláknak, amely 
szeletek kedvező aszinkron keresztkorrelációs tulajdonsággal rendelkeznek. 


Uplink irányban minden felhasználó használhatja ugyanazt a csatornaképző 
kódot. Ezen irányban mind a 2"! — 1 szóhosszú Gold-kódok szeleteit, mind a 
256 bites szóhosszú Kasami nagy halmaz (VL-Kasami, Very Large set) szavait 
használják. Ezen rövidebb szóhosszú kód alkalmazása jelentősen egyszerűsíti a 
többfelhasználós detekció (multiuser detection) algoritmus implementálását a bá- 


zisállomáson. 
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4.20. Feladatok 


Lineáris blokk-kódok 


4.1. feladat. Egy (0,1,2) kódábécéjű GF(3) feletti lineáris kód generátormát- 


rixa: 
1021 
S 65 


Adja meg a kódszavakat, valamint a d minimális távolságot! 


4.2. feladat. Egy lineáris bináris kód paritásellenőrző mátrixa 
H — (1 1 1 11 1). Adja meg a kód következő paramétereit: n,k, d, kód- 
szavak száma! 


4.3. feladat. Egy lineáris bináris blokk-kód generátormátrixa: 
10110 
SE fh in? 


a) a kód paramétereit: n, k, d, 


Adja meg 


b) standard elrendezési táblázatát, 
c) szindróma dekódolási táblázatát, 


d) a kódszó dekódolási hibavalószínűséget emlékezetnélküli BSC(p) esetére! 


4.4. feladat. Egy lineáris bináris kód paritásellenőrző mátrixa: 


11100 
H— ( 10010 
11001 


Adja meg a szindróma dekódolási táblázatot! 


4.5. feladat. Egy lineáris bináris kód generátormátrixa az alábbi: 


101011 
G — [ 011101 
011010 
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Adja meg: 
a) egy ekvivalens szisztematikus kód generátor- és paritásellenőrző mátrixát, 


b) a duális kód kódszavait (duális kód — a paritásellenőrző mátrix mint gene- 
rátormátrix által generált kód). 


4.6. feladat. Adja meg a GH(4) feletti C(4, 2) paraméterű, 
1022 
his 2) 


generátormátrixú kód szindróma dekódolási táblázatát! 060, 191,26-x, 
39x101] 





4.7. feladat. Definiáljon egy (5,3) paraméterű GF(4) feletti kódot a generátor- 
mátrixa, amely 
10011 
G — Í 01012 
00113 


a) Mennyi a kód minimális távolsága? 

b) Perfekt-e a kód? 

c) Mi lehetett az átküldött kódszó, haavettszó(1 ? 1 3 ?)? 
A kód tisztán 0, 1 elemeket tartalmazó kódszavakat is tartalmaz. 

d) Adja meg a bináris kódszavakat! 


e) Igazolja, hogy ezen bináris kódszavak részkódot alkotnak az eredeti kód- 
ban! 


f) Adja meg ezen részkód (n, k, d) paraméterhármasát! 
g) Adja meg a részkód generátormátrixát! 


4.8. feladat. Egy GF(5) feletti (5,3) paraméterű lineáris kód kódszavai között 
vannak a (0,1,0,1,2), (1,0,0,1,4), (0,0,1,1,3) szavak is. Adja meg a kód hiba- 
javító képességét! 


4.9. feladat. Adja meg egy (21, 18) paraméterű GF(4) feletti, egy hibát javító kód 
paritásmátrixát és generátormátrixát. 
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4.10. feladat. Adja meg a legkisebb kódszóhosszú GFC3) feletti, 1 hibát javító, 
k — 2 üzenethosszú szisztematikus kódot paritásellenőrző mátrixával! 


4.11. feladat. Létezik-e C(n,k), n — k — 2, GFC) feletti 1 hibát javító kód? Ha 
igen, adja meg szisztematikus mátrixaival! 


4.12. feladat. Adja meg a C(n,k — 1) paraméterű bináris kód C" duális kódját 
(duális kód — paritásellenőrző mátrix mint generátormátrix által generált kód), s 
annak paraméterhármasát! Adja meg C" szavait n — 4 esetén! 


4.13. feladat. Létezhet-e olyan GF(g) feletti lineáris blokk-kód, amelynek gene- 
rátormátrixa egyben a kód paritásellenőrző mátrixa is? Ha válasza igen, mutasson 
példát rá, mind g — 2, mind pedig g - 2 esetben. 


4.14. feladat. Valaki azt állítja, hogy ha egy C(n — 2m— 1,k) lineáris bináris 
kódnak a csupa 1 kódszó eleme, akkor pontosan eggyel kevesebb páros paritású 
nemzérus kódszava van, mint páratlan paritású. Igaza van-e? 


4.15. feladat. Legyen C(n, k) egy lineáris bináris blokk-kód, amelynek generátor- 
mátrixában nincsen csupa zérus oszlop. Igaz-e, hogy az összes kódszó egyeseinek 
összesített darabszáma n -271? 


4.16. feladat. Egy GF(g) feletti lineáris blokk-kód paritásellenőrző mátrixa 
1 1 1 --. 1 
H— ( Oo e DERÓ ően 
ahol c a test primitív eleme. Adja meg a kódtávolságot! 


4.17. feladat. A legegyszerűbb konstrukciójú hibajavításra már alkalmas nemtri- 
viális kód a kétdimenziós bináris paritáskód. (Az üzenetet mátrixba rendezzük, 
soronként és oszloponként paritásbittel egészítjük ki, majd a jobb alsó sarokba 
írjuk a paritások paritását.) Mennyi a minimális távolság? 


4.18. feladat. Igazolja, hogy a kétdimenziós bináris paritáskód jobb alsó paritás- 
elemét (azaz a paritások paritását) képezhetjük akár a sorparitások paritásaként, 
akár az oszlopparitások paritásaként, azaz mindkét esetben azonos eredményre 
jutunk. 


4.19. feladat. Egy bináris blokk-kódot a 2.5. szakaszban megismert Walsh-Ha- 
damard-mátrix segítségével állítunk elő. A generált C(?) kód szavai az A2r mátrix 
soraiból, valamint azok komplemenseiből álljanak. 
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a) Lineáris-e a kód? 
b) Adja meg a CÉ" kód n,k,d paramétereit r függvényében! 


4.20. feladat. Konstruáljon egy GF(g), g — 2" feletti (g--1,9g— 1) paraméterű 1 
hibát javító lineáris blokk-kódot. 


a) Adja meg a szisztematikus paritásellenőrző mátrixot! 
b) Perfekt-e a kód? 


c) Adja meg g — 4 esetre a generátormátrixot! (060, 1681,268x,36 
xt1) 





4.21. feladat. Igaz-e, hogy tetszőleges C(n,k,d — 3) paraméterű lineáris kódot 
egy paritásszimbólummal kiegészítve C"(n -- 1,k,d — 4) paraméterű kódot ka- 
punk? 


Kalkulus 


4.22. feladat. Egy egyenlő oldalú háromszöggel háromféle elemi transzformá- 
ciót végezhetünk: 


e e: helybenhagyás 
e t: tengelyes tükrözés 
e f: középpont körüli 1207-os forgatás 


A szorzás művelet két elemi transzformáció között legyen azok egymás utáni al- 
kalmazása. Adja meg ezen transzformáció csoport műveleti tábláját, részcsoport- 
jait! 


4.23. feladat. Mutassa meg, hogy az egészek (--, —, zéró) halmaza nem csoport 
a kivonás műveletre! 


4.24. feladat. Legyen § egy véges halmaz, valamint G az § részhalmazainak hal- 
maza. 


a) Mutassa meg, hogy G a halmazunió művelettel nem alkot csoportot! 


b) Mutassa meg, hogy G az AAB — (A— B) U(B — 4) szimmetrikus differencia 
művelettel csoportot alkot! 
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c) Mutassa meg, hogy a , A" és , n7 (halmaz metszet) műveletekkel G gyűrűt 

alkot! (A - és x bináris műveletekkel bíró R halmazt gyűrűnek nevezzük, 

ha R az összeadásra nézve Abel-csoport, a szorzásra nézve félcsoport, és a 
műveletek között érvényesek a disztributivitási szabályok.) 


4.25. feladat. Adja meg a mod 7 szorzócsoport egy mellékosztály dekompozí- 
cióját! 


4.26. feladat. Adjon példát egységelem nélküli gyűrűre! 


4.27. feladat. Mutassa meg, hogy a p(x) — x? — 1 polinomnak több, mint két 
gyöke vana mod 15 gyűrűben! Nem ellentmondás ez? 


4.28. feladat. Tekintse az S — (0,1,2,3) halmazt az alábbi műveleti táblák sze- 
rinti , 4" és , x" műveletekkel: 


FO12B3 x 0123 
00123 00000 
1 1 2 30 T (0 1. 2. 3 
2 2 30 1 20 231 
3 30 12 30 3 12 


Testet kapunk-e? 
4.29. feladat. Konstruálja meg GF(4) műveleti tábláit! 
4.30. feladat. Konstruálja meg GF(8) műveleti tábláit: 


a) Az x? 4x-1 bináris irreducíbilis polinom felhasználásával! 


b) Ismételje meg a konstrukciót az x? 3- x? -- 1 bináris irreducíbilis polinom 
felhasználásával, s mutassa meg hogy a két test izomorf (az elemek átneve- 
zésével azonos műveleti táblákhoz jutunk)! 


4.31. feladat. Legyen adva GF(4) a következő műveleti táblákkal: 


FO1I12B3 x 0123 
00123 00000 
1. 1 -0 3.2 10123 
2.2.-3.-0. 1 20 2 31 
3. 3210 3.10. 03 AL 2 
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a) Oldja meg az alábbi GF(4) feletti egyenletrendszert: 


2x 1-y 
x 32y 


b) Számítsa ki az alábbi GF(4) feletti mátrix determinánsát! 
2-V.2 
detíl 1 2-7? 
10 1 


4.32. feladat. Adja meg az x4-1 € GF(8) polinom alakban megadott testelem 
inverzét, ha x? -- x2 3-1 az aritmetika generáló polinom! 


4.33. feladat. Adja meg a GF(8) test elemeinek bináris minimálpolinomját! 
4.34. feladat. 
a) Mutassa meg, hogy a p(x) — x? 4-x? 4-2 GF) feletti polinom irreducíbilis ! 
b) Adja meg GF(7) elemeinek rendjét! 


c) Mi az x polinom által reprezentált elem rendje GF(27)-ben, ha p(x) az arit- 
metika generáló polinom? 


4.35. feladat. Konstruálja meg GF(9) műveleti tábláit! 


4.36. feladat. A GF(16) test összeadó- és szorzótábláját többféleképpen is meg- 
konstruálhatjuk: 


a) GF) feletti 4-edfokú irreducíbilis polinommal, 
b) GF(4) feletti 2-edfokú irreducíbilis polinommal. 


Kövessük a b) utat! 


4.37. feladat. A p(x) — x971-x? 2-1 GF) feletti polinommal GF(2?9) konstru- 
álható, ahol az x polinom által reprezentált elem primitív: 


a) Adja meg ezen test résztesteinek méretét! 


b) Mely résztesteknek nincsen további részteste a GF(2) testen kívül? 


4.38. feladat. Igaz-e, hogy (x—3)(x--2)(x-- 8) I (x1é 4 10x6) GFE(11) felett? 
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4.39. feladat. Legyen c primitív elem a GH(16) testben, amelynek bináris mini- 
málpolinomja x! -x-k 1. Adja meg az o, minimál polinomját GF(4) felett! 


4.40. feladat. Adja meg az xf — 1 polinom GF(3) feletti irreducíbilis polinomokra 
történő faktorizációját! Mennyi különböző, n — 8 hosszúságú, GF(3) feletti cikli- 
kus kód van? 


4.41. feladat. f(x) — 3x! 3 2x 4 egy GF(5) feletti polinom. Adjuk meg az 
[f(x polinomot explicit alakban! 


4.42. feladat. 


a) Hány különböző másodfokú x? -- ax 4 b alakú (fődpolinom van GF(16) fe- 
lett? 


b) Hány különböző (x—B)(x —y), B,Y- 0 alakú polinom van GH(16) felett? 


c) Adja meg a GI(16) feletti irreducíbilis másodfokú főpolinomok számát! 


4.43. feladat. Igaz-e, hogy egy c ec GH(g) primitív elem konjugáltja is primitív 
eleme a testnek, ahol g — 2" ? 


4.44. feladat. Legyen B egy GF(g) test nemzérus eleme. Mi az a legkisebb n 
érték, amelyre B -- B? -- B? -- : . . 4 B" — 0 teljesül? 


4.45. feladat. Legyenek § és 7 különböző kétdimenziós alterek egy háromdi- 
menziós vektortérben. Mutassa meg, hogy § és T metszete egydimenziós altér! 


4.46. feladat. Származzanak az x,y és z vektorok egy GH(p), p prím, feletti li- 
neáris blokk-kód egy generátomátrixa sorvektorainak halmazából. Lehetnek az 
x ty,ytz,x-z vektorok ugyanezen kód valamely más generátormátrixának so- 
rai közül valók, 


a) ha p —2, 

b) hap5 2? 
4.47. feladat. Legyen a c GF(g), g — 2", egy n-edrendű elem, továbbá 
MEZ KESES 0 EAST kezén) 


ez 5 10 5i 5(n—1 
b — (1..oő, az szmn Ól ). . . , DŐL 1) 


a 


Ortogonálisak-e ezen vektorok? 
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4.48. feladat. Tekintse a p(x) — x? --1 és g(x) — xt-hx? 4x2 7-1 bináris polino- 
mokat. 

a) Számolja ki a legnagyobb közös osztót: Inko(p(x), g(x))-et! 


b) Adjon meg A(x), B(x) polinompárt, amelyre 
Inko(p(x), a(x)) — A(x)p(x) 4- B(x)a(x) fennáll. 


4.49. feladat. 
a) Számolja ki a legnagyobb közös osztót: Inko(1753, 308 )-at! 


b) Adjon meg A, B egészeket, amelyre Inko(1753, 308) — 1753A -- 308B. 


4.50. feladat. Kalkulátor használata nélkül adja meg 86$ 47?!! mod 3 értékét! 


Ciklikus kódok 


4.51. feladat. Valaki azt állítja, hogy egy 1 hibát javító bináris ciklikus kód egyik 
szava 0001111. Lehetséges ez? 


4.52. feladat. Tekintsük a g(x) — x" 4 x? 4 1 generátorpolinomú, n — 7 kódszó- 
hosszú bináris Hamming-kódot. 


a) Adja meg a kód h(x) paritásellenőrző polinomját és szisztematikus alakú 
generátormátrixát! 


b) Tekintsük a kód nem páros súlyú szavainak halmazát. Adja meg ezen rész- 
kód méretét, valamint minimális távolságát! 


c) Tekintsük a nem páratlan súlyú szavainak halmazát. Lineáris, illetve cikli- 
kus-e ez a halmaz, s mik a paraméterei? 


4.53. feladat. A g(x) —x? 1-x-1 bináris polinom egy 7 kódszóhosszú Hamming- 
kód generátorpolinomja. Adja meg 


a) a kódszavak halmazát, 
b) a minimális távolságot, 


c) a paritásellenőrző polinomot! 
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4.54. feladat. Egy n — 7 kódszóhosszú bináris ciklikus blokk-kód generátorpoli- 
nomja g(x) — x— 1. Adja meg a 


a) lehetséges kódszósúlyokat, és a k, d paramétereket, 
b) paritásellenőrző polinomot, 


c) szisztematikus paritásmátrixot! 


4.55. feladat. Egy n — 7 hosszú bináris ciklikus kód generátorpolinomja g(x) — 
X5 4 pxt xx hx? 1-x-B1. Adja meg a kódszavak halmazát! 





4.56. feladat. 
a) Hány különböző 7 kódszóhosszú bináris ciklikus kód van? 


b) Adja meg (n,k,d) paramétereivel és g(x) generátorpolinomjával az összes 
lehetséges bináris n — 7 kódszóhosszú ciklikus kódot! 


4.57. feladat. Egy C" kódot úgy származtatunk, hogy egy g(x) generátorpoli- 
nomú C(n,k), GE(a) feletti Reed-Solomon-kód kódszavait tükrözzük, azaz ele- 
meit fordított sorrendben tekintjük (ci — ca-1—i, 1— 0,1,...,n— 1). 


a) Ciklikus-e C"? 


b) Ha az a) kérdésre a válasz igen, akkor adja meg a C" kód g"(x) generátor- 
polinomját g(x) alapján, továbbá annak gyökeit, ha g(x) gyökei 01, 02, . . . , 
On—k. 


4.58. feladat. Egy C(n,k), n — 27 — 1 bináris ciklikus kód g(x) generátorpoli- 
nomját osztja az x -- 1 polinom. Eleme-e a kódnak a csupa 1 szó? 


4.59. feladat. A g(x) — xx? 41 polinom egy n — 7 kódszóhosszú bináris 
Hamming-kód generátorpolinomja. Adja meg a kód h(x) paritásellenőrző poli- 
nomjára épülő, szisztematikus kódolást nyújtó visszacsatolt shiftregiszteres kó- 
doló eszköz blokksémáját! 


4.60. feladat. Egy C1(n, ki, d1) illetve egy C2(n, ka, d2 ) ciklikus kód h1(x) illetve 
h2(x) paritásellenőrző polinomja közötti kapcsolat h1(x) ] h2(x). Mi a kapcsolat: 


a) Ci és Cs között, 


b) d1 és d2 között? 
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4.61. feladat. Egy C1(n1,k1) ciklikus kód egy C2(n2,k2 ) ciklikus kód részkódja. 
Mi az algebrai kapcsolat a megfelelő 

a) hi(x),h2(x) paritásellenőrző polinomok között, 


b) g1(x), 22(x) generátorpolinomok között? 


4.62. feladat. Mennyi különböző, n — 8 kódszóhosszú GF(3) feletti ciklikus kód 
van? 


4.63. feladat. Egy n — 15 kódszóhosszú C bináris Hamming-kód H paritásellen- 


őrző mátrixának oszlopai az 1, 2, . . . 15 egészek bináris alakjai. Adjon meg egy 
13 ij, 2— i;, ..., 15 — i15 permutációt, hogy a keletkező C" kód már ciklikus 
legyen! 


4.64. feladat. Igazolja, hogy egy h(x) paritásellenőrző polinomú ciklikus kód pa- 
ritásellenőrző mátrixának sorait a (0, 0, . . . , hx, hk-1, . . . , 10) vektor ciklikus eltolá- 
saival nyerhetjük. 


4.65. feladat. Képezzük a CRC-t a g(x) — x 3x? 3-x2 11 generátorpolinommal. 
Jelez-e hibát a detektor, ha a vett szó 0000 0001 0011 1011, ahol a jobb oldali bit 
a zéró helyiértékű? 


4.66. feladat. A következőket állítja valaki: 


a) Egy C(n,k) ciklikus lineáris kód h(x) paritásellenőrző polinomját használ- 
hatom egy n kódszóhosszú C" kód generátorpolinomjaként. 


b) A C" kód minimális kódtávolsága elérheti a k -- 2 értéket is. 


Igazak-e az állítások? 


Kódkorlátok 


4.67. feladat. Konstruálható-e n — 11,k — 5 paraméterű t — 2 hibát javító bináris 
kód? 


4.68. feladat. Valaki azt állítja, hogy olyan kódot tervezett, amely 7 redundancia- 
karakterrel meghosszabbítja az üzenetblokkot, és 4 véletlen hibát képes javítani a 
kódszóban. Lehetséges ez? 
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4.69. feladat. Létezik-e C(n,k), n—k — 2, GF(3) feletti egy hibát javító kód? 
Ha igen adjon példát, megadva a szisztematikus paritásellenőrző mátrixát és a 
kódszavait! 


4.70. feladat. Perfekt-ea ((I1 1 1 1 1 1 1),(0 0 0 0 0 0 0) 
kódszavakat tartalmazó kód? 


4.71. feladat. Perfekt-e egy C(11,6) paraméterű GF(3) feletti 2 hibát javító kód? 


4.72. feladat. Igazoljuk, hogy egy MDS-kód duálisa is MDS tulajdonságú! 


RS-kódok 


4.73. feladat. Tekintsünk egy GIH(I1) feletti Reed-Solomon-kódot g(x) — 
(x—2)(x—4)(x— 8)(x— 5) generátorpolinommal. Adja meg a kód következő 
jellemzőit: minimális távolság (d), hibajavító képesség (z.), hibadetektáló képes- 
ség (tg), törlésjavító képesség (te)! 





4.74. feladat. Adja meg egy GH(11) feletti három hibát javító, primitív szóhosszú 
Reed-Solomon-kód paramétereit, generátorpolinomját, paritásellenőrző polinom- 
ját! 


4.75. feladat. Tekintsünk egy GH(13) feletti 2 hibát javító primitív szóhosszú 
Reed-Solomon-kódot. 


a) Adja meg a generátorpolinomjával! 


b) Állítsa elő az u(x) — 2x-- 1 üzenethez tartozó kódszót transzformációs kó- 
dolással! 


4.76. feladat. Eleme-e az (1,1,..., 1) csupa 1 vektor egy GF(g) feletti C(n,k), 
n — g— 1 Reed-Solomon-kódnak, ahol a generátorpolinom gyökei az c primitív 
elem 0, 1,2,...,n—k— 1 hatványai? 


4.77. feladat. Egy t hibát javító GF(g) feletti Reed-Solomon-kód generátorpoli- 
nomjának gyöke az Oo primitív elem 2, . . . , 212-edik hatványa. Lehetséges-e, hogy 
a kódszavak elemeinek (koordinátáinak) összege a test zéró eleme legyen? 


4.78. feladat. Legyen a(") — (1, or, or, . . . am Dr), r—0,1,...,n—1, ahol az € 
GF(g) egy n-edrendű elem. Igaz-e, hogy ha egy C(n,k) kód G generátormátrixá- 
nak sorai rendre a(", r— 0, 1, . . . ,k— 1, akkor H mátrixának sorai lehetnek rendre 
az al, r—1,...,1—k vektorok? 
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4.79. feladat. Legyen a(") — (1,ar, or... ,alnr), r -0,1,...,n— 1, ahol 
GF(g) egy n-edrendű elem. Van-e olyan C(n,k) kód, amelyre a G és H mátri- 
xainak sorai rendre ugyanazok az a") alakú vektorok? 


4.80. feladat. Legyen g(x) —x? 1-x--1 egy C(7, 4) bináris Hamming-kód generá- 
torpolinomja. Mutassuk meg, hogy C lineáris részkódja egy C"(7,5) GF(8) feletti 
Reed-Solomon-kódnak! 


4.81. feladat. Igaz-e a következő állítás? Egy C(n,k,d) GF(g) feletti Reed—So- 
lomon-kód kódszavaiból kiemelve bármely, rögzített k méretű koordinátahalmaz 
által meghatározott részvektorokat, azok különbözők a különböző kódszavakra. 


BCH-kódok 


4.82. feladat. Adjuk meg egy egy hibát javító n — 8 primitív szóhosszú, GF(3) 
feletti kód 


a) üzenethossz (k) paraméterét, 
b) generátorpolinomját! 
(Segítség: f(x) — xx 1-2 egy GF) feletti irreducíbilis polinom). 


4.83. feladat. Adjon meg egy bináris n — 15 kódszóhosszú, 2 hiba javítására al- 
kalmas kódot bináris generátorpolinomjának explicit megadásával! 


4.84. feladat. n — 31 kódszóhosszú t — 2 hiba javítására alkalmas bináris BCH 
blokk-kódot tervezünk. Adja meg a keletkező kód 


a) k paraméterét, 
b) generátorpolinomját! 
(Segítség: f(x) — x 1 x? --1 egy primitív irreducíbilis bináris polinom). 


4.85. feladat. Adja meg egy GFC3) feletti n — 91 primitív kódszóhosszú ft — 7 
hibajavító képességű BCH-kód üzenethossz paraméterét! 


4.86. feladat. Adja meg a GF(8) feletti (9, 7) paraméterű 1 hibát javító BCH-kód 
generátorpolinomját gyöktényezős alakban! 


4.20. FELADATOK 309 


Konvolúciós kód 


4.87. feladat. Mekkora a d.. minimális távolsága (szabad távolsága) a 
G(x) — (x21-x-k1, xx 1) 
generátorpolinom-mátrixú konvolúciós kódnak? 


4.88. feladat. Adjon meg egy t — 2 véletlen hiba javítására alkalmas bináris R — 
5 sebességű konvolúciós kódot generátorpolinom-mátrixával! 


4.89. feladat. Egy ; sebességű bináris konvolúciós kód generátorpolinomjai: 17, 
15 (együtthatók oktális ábrázolásban). 


a) Adja meg a kódoló vázlatát! 
b) Katasztrofális tulajdonságú-e a kód? 


c) Mekkora a szabad távolság (d..)? 


4.90. feladat. Adja meg a következő, generátorpolinom-mátrixával megadott R — 
ki sebességű bináris konvolúciós kód kódoló blokksémáját, valamint d.. szabad 


távolságát! 
x xXi10 
me G 0 ) 


4.91. feladat. Mekkora a sebessége, s a minimális távolsága a G(x) — (1, x2 1) 
generátorpolinom-mátrixú konvolúciós kódnak? 


4.92. feladat. Tekintsük a G(x) — (x? FI], x3x-k 1) generátorpolinom-mátri- 
xú konvolúciós kódot. Adja meg az állapotátmenet-gráfját, s a szabad távolságát 
(do)! 


4.93. feladat. Katasztrofális tulajdonságú-e az alábbi blokksámával megadott kó- 
doló? 
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Kódkombinációk, kódmódosítások 


4.94. feladat. Adja meg a g(x) — x? 4 x-6- 1 generátorpolinomú C(7,4) kód nem 
páratlan súlyú szavai C" részkódjának halmazát, s ezen részkód paramétereit! 


4.95. feladat. Perfekt marad-e a C(n,k) bináris Hamming-kód, ha kódrövidítést 
hajtunk végre, amelynek mértéke 


a) l bit, 
b) 2 bit? 


4.96. feladat. A C(7,4) bináris Hamming-kód kódszavait paritáskarakterrel bő- 
vítjük páros paritásúra egészítve ki a kódszavakat. Adja meg a kapott kód para- 
métereit! 


4.97. feladat. A (7,4) bináris Hamming-kódból kiindulva konstruáljon bináris 
kódot, amelynek 8 kódszava van, 7 a szóhossza és alkalmas 3 hiba detektálására. 


4.98. feladat. A g(x) — x" 1-x? -- 1 generátorpolinomú szisztematikus Hamming- 
kódon 3 bites kódrövidítést hajtunk végre. 


a) Adja meg a rövidített kód (n,k) paramétereit! 
b) Adja meg a kódszavakat és a kód d paraméterét! 


4.99. feladat. Adja meg a 8 bitnyi kódrövidítéssel kapható kód paramétereit és 
kódszavait, ha a g(x) — x 4x-1- 1 generátorpolinomú bináris Hamming-kódot 
rövidítettük. 


4.100. feladat. C(n,k), n — 91 kódszóhosszú 7 hibát javító bináris blokk-kódot 
szeretnénk konstruálni. Egy megfelelő primitív szóhosszú C"(N, K) bináris BCH- 
kód rövidítésével oldjuk meg a feladatot. Adja meg az N, K,k paramétereket! 


4.101. feladat. Legyen C(255,251) egy GF(256) feletti Reed-Solomon-kód, 
amelynek generátorpolinomja g(x) — (x—1)(x—o)(x— 0?) (x— c), a c GF(256) 
primitív elem. 





a) Igazolja, hogy a bináris kódszavak C bináris ciklikus C" alterét alkotják! 


b) Mi ezen C" altér generátorpolinomja és mik C" paraméterei? 
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4.102. feladat. Egy bináris lineáris C(n,k, d) kód nem tartalmazza a csupa egye- 
sekből (1) álló kódszót. Mit mondhatunk aC —C81 kódról, ahol € a koordiná- 
tánkénti mod 2 összeadás? 


a) Lineáris-e? 
b) Mik a paraméterei: nm", k",d" ? 
Mit mondhatunk a C" — CUC" kódról, ahol U a halmazegyesítés: 
c) Lineáris-e? 
d) Mik a paraméterei: n",k" d" ? 


4.103. feladat. Egy GH(g) feletti n — g — 1] szóhosszú C Reed-Solomon-kód ge- 


FdB 5.) 


nerátorpolinomjának gyökei Gt, 07, . . . , od! , a ec GF(g). A kódot egy , paritás 


karakterrel bővítjük, olyan módon, hogy a kódszó karaktereinek testbeli aritme- 
tika szerinti összege lesz az n -- 1-edik karakter. MDS tulajdonságú marad-e a 
kapott g szóhosszú kód? 


4.104. feladat. Egy kommunikációs csatornán nagyon ritkán maximum 8 bit 
hosszú hibacsomók keletkeznek. A következő beállítható paraméterű kódolási 
elemekben gondolkozunk: 


a) bináris Hamming-kódoló, 
b) bájt karakter alapú Reed-Solomon-kódoló, 


valamint alkalmazhatjuk a kódátfűzés technikát is. A cél minimális redundancia 
mellett elvégezni a javítást. Milyen konstrukciót alkalmazzunk? 


Hibajavító dekódolás 


4.105. feladat. Adja meg egy GFH(g) feletti, egy hibát javító BCH-kód PGZ-dekó- 
dolás szerinti általános dekódolási algoritmusát a szindrómaegyenletek közvetlen 
megoldásával! 


4.106. feladat. Egy GH(11) feletti lineáris blokk-kód paritásellenőrző mátrixa 
1 1 1 -- 1 
HEG ű a 02 ... ő) í 


ahol a — 2 a test primitív eleme. 
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a) Adja meg a kód paramétereit! 
b) Adja meg a dekódolás menetét az e(x) — 5x? hibapolinom esetére ! 


4.107. feladat. Adja meg egy GF(g) feletti két hibát javító bináris BCH-kód álta- 
lános dekódolási algoritmusát a szindrómaegyenletek közvetlen megoldásával! 


4.108. feladat. Valaki azt állítja, hogy nem feltétlenül kell egy GF(2") feletti 
C(n -— 2" —1,k) bináris kód generátorpolinomjában 4 ciklikusan egymás utáni 
gyöknek lennie ahhoz, hogy a kód zt — 2 hibát javíthasson. Szerinte az is megfe- 
lelő, ha a g(x) generátorpolinom olyan, hogy g(a) — g(a7!) — 0, ahol ca GFO") 
primitív eleme. Igaza van-e? 

(Segítség: A szindrómaegyenletek megoldhatóságnak közvetlen vizsgálatával el- 
lenőrizze az állítást.) 


4.109. feladat. Valaki a következő gondolatmenetet mondja a társának: 

Én úgy tudom, hogy egy C (n,k) lineáris bináris blokk-kód szindróma dekódolási 
táblázata mindig 2(r-9 javítható hibamintát tartalmaz, tehát végülis a minimá- 
lis távolságnak nincs jelentősége, s mindegyik (n,k) paraméterű kód egyformán 
hasznos (hasznos — emlékezetnélküli BSC csatornán használva azonos kódszó- 
dekódolási hibavalószínűséget kapunk). Tömör érveléssel tegyen igazságot! Mu- 
tasson egy egyszerű példát is! 


4.110. feladat. A és B beszélgetnek: 

A: A BCH-kódok PGZ-szindróma dekódolási algoritmusa egy maximum t 
súlyú hibavektort tud korrigálni. Tehát, ha több hiba esett, mint t, és a vett szó 
minden kódszótól távolabb van, mint t, akkor a dekódolt szó nem lehet kódszó, 
azaz újbóli szindrómaszámítással lehetőségünk van ellenőrizni a dekódolás he- 
lyességét. 

B: Itt valami csalás van, hiszen szindróma dekódoláskor a dekódolt szó szind- 
rómáját mindig zérusra korrigáljuk, mivel a vett szóból levonjuk a vett szó szind- 
rómájának megfelelő szindrómájú hibavektort. 

Hol az igazság? 


4.111. feladat. Egy C(n,k) blokk-kód dekódolását szindróma dekódolási táblázat 
alapján végezzük. Az alábbi két állítás közül melyik az igaz és miért? 
a) A dekóder kimenetén az aktuális hibázástól függetlenül mindig valamilyen 


(esetleg hibás) kódszó jelenik meg. 


b) A dekóder a táblázat alapján egyszerűen levon a vett szóból egy hibamintát, 
így súlyosabb hibázás esetén előfordulhat, hogy nem egy kódszó jelenik 
meg a kimeneten. 
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4.112. feladat. Egy egy hibát javító GFC7) feletti g(x) — (x— 0)(x— 02), a — 3, 
generátorpolinomú Reed-Solomon-kód egy kódszava hibásan, de még javítha- 
tóan érkezett meg a vételi oldali dekódolóhoz. A vett szó (vo, V1, V2, V3, V4, V5) — 
(6,0,5,2,4,0). Mi lehetett az átküldött kódszó? 


4.113. feladat. Egy GK(11) feletti C(10, 6) 2 hibát javító Reed-Solomon-kód ge- 
nerátorpolinomja g(x) — (x—2)(x— 4)(x— 8)(x— 5), a — 2. Egy vett szóra a 
dekóder a következő szindrómákat számította ki a gyököknek megfelelő sorrend- 
ben: 3,6, 1,2. Adja meg a hibapolinomot! 





4.114. feladat. Egy GE(7) feletti C(6, 2) Reed-Solomon-kód generátorpolinomja 
2(x) — (x—3)(x—2)(x—6)(x— 4), a — 3. Egy vett szóra a dekóder a következő 
szindrómákat számította ki a gyököknek megfelelő sorrendben: 5,5,4,2. Adja 
meg a 





a) hibahelypolinomot, 


b) hibapolinomot! 


4.115. feladat. Egy C(15,5) paraméterű tr — 3 hibát javító bináris BCH-kód gyö- 
kei a következő GF(16) testelemek: a, aZ, 0? , of , 00? , 06. A GF(16) aritmetikát az 
f(x) — xx 1 polinommal generáljuk. A dekóder a következő szindrómákat 
számította a fenti gyökök sorrendjében: 02, 2, 0, o? , 1, 0. Adja meg a 


a) hibahelypolinomot, 


b) hibapolinomot! 


4.116. feladat. Egy GH(11) feletti g(x) — (x— 2)(x — 4) generátorpolinomú pri- 
mitív szóhosszú Reed-Solomon-kód dekóderéhez érkezett vett szóból 2 karakter 
törlődött: 
0. 1. da 9. 
(8 200200 ? 0 ?) 


Mik a törlődött karakterek? 


4.117. feladat. Van GF(256) aritmetikában gyorsan számoló egységünk. A csa- 
torna hibázása olyan, hogy ritkán, legfeljebb 16 bit hosszú hibacsomók keletkez- 
hetnek. Milyen kódot javasol a javításra, ha maximalizálni szeretnénk a kódolási 
sebességet? 
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4.118. feladat. Egy üzenetforrás kimenetén 8 különböző karakter jelenhet meg. 
Ha ezeket a karaktereket az átviteli csatornán továbbítjuk, akkor alkalmanként 
egy karakter meghibásodik, de két hibás karakter közti távolság legalább 10 ka- 
rakter. Blokk-kódos hibajavítást szeretnénk alkalmazni azzal a megkötéssel, hogy 
a relatív redundancia nem haladhatja meg a 30 90-ot. Javasoljon megoldást a hi- 
bajavításra, adja meg az alkalmazandó kódot! 


Hibadetekció 


4.119. feladat. Valaki azt állítja, hogy tetszőleges m fokszámú, bináris f(x) po- 
linom, amelynek konstans tagja 1, alkalmas arra, hogy CRC generátorpolinom- 
ként detektáljunk vele tetszőleges, legfeljebb m bit hosszúságú hibacsomagot. (Pl. 
1xxx1 egy 5 hosszú hibacsomag.) Igaza van-e? 


4.120. feladat. Egy hibadetekciós protokollban a 000...0011 (két utolsó bitjén 
1-et tartalmazó) üzenetcsomaghoz a g(x) — x!5 -- x!? -4x 41 szabványos ge- 
nerátorpolinommal ciklikus redundancia ellenőrző összeget (CRC) alkalmazunk. 
Adja meg az ellenőrzőösszeggel ellátott blokkot! 


Hibavalószínűség 


4.121. feladat. Egy bináris kód generátormátrixa 
11001 
báli 48 1 1! j 
A kódot emlékezetnélküli BSC(p) csatornán hibadetekcióra illetve hibajavításra 
használjuk. A hibajavítás algoritmusa a legközelebbi kódszóra döntés. Adja meg 


mindkét alkalmazás esetén a hibázás valószínűségét! (A forrás azonos valószínű- 
séggel sorsolja az üzeneteket.) 


4.122. feladat. Egy C(n,k) paraméterű GF(g) feletti, t hibát javító perfekt kódot 
hibajavításra használunk szimmetrikus emlékezetnélküli csatornán, ahol a hibázás 
valószínűsége p. Adja meg egy kódszó téves dekódolásának valószínűségét! 


4.123. feladat. Emlékezetnélküli szimmetrikus g-áris (0,1,...,g input ábécé, 
0, 1, . . . , g output ábécé) csatornán kommunikálunk, ahol a hibázás valószínűsége 
p (R(ilj)— p, i A j). Egy (n.k) paraméterű GF(g) feletti t hibát javító perfekt 
kódot használunk csatornakódként. Adja meg egy kódszó téves dekódolásának 
valószínűségét! 
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4.124. feladat. Tekintsük a g(x) — xtxtl generátorpolinomú bináris Ham- 
ming-kódot. A kódot hibajavításra használjuk. Adja meg egy kódszó téves dekó- 
dolásának valószínűségét! 

4.125. feladat. A (8,4) paraméterű paritásbittel bővített bináris Hamming-kódot 
hibadetekcióra használjuk p hibázási valószínűségű emlékezetnélküli bináris szim- 
metrikus csatornán. Adja meg a detekció mulasztás valószínűségét! 


4.126. feladat. A C(n,k — 1) paraméterű bináris ismétléses kódot 
a) tisztán törléses csatornán 
b) véletlen bithibázásos csatornán 


használjuk, ahol a törlés illetve hibázás valószínűsége p. Adja meg mindkét eset- 
ben egy kódszó téves dekódolásának valószínűségét! 


4.127. feladat. 1 bitnyi üzenetet úgy viszünk át a csatornán, hogy ismételjük azt, 
azaz a (00...0) illetve az (11...1) szavak valamelyikét küldjük át. Legyen p — 
0.01 a bithibázás valószínűsége az emlékeznélküli bináris csatornában. Meny- 
nyivel javul a téves dekódolás valószínűsége, ha n — 3 hosszú szavak helyett n — 5 
hosszúakat használunk? 


4.128. feladat. Az alábbi méretű kétdimenziós paritáskódot paritásellenőrzésre 
használjuk (u: üzenetbit, p: paritásbit) 


u u p 
u u p 
PP 5 Pp 
Adja meg a hibadetekció elmulasztásának valószínűségét emlékezetnélküli BSC(p) 


csatorna esetén! 


4.129. feladat. Egy bináris, tisztán törléses emlékezetnélküli csatornán p — 0.05 
a törlés és 1— p — 0.95 a hibátlan továbbítás valószínűsége. Félbájtos (4 bit) 
egységekben továbbítjuk a forrás információját, amelyet 4 bit redundanciával ki- 
egészítünk kódszóvá. Hasonlítsuk össze az alábbi két kódolási eljárást a kódolási 
hatékonyság szempontjából: 


a) a redundancia nem más mint az üzenet félbájt megismétlése, 


b) a (8,4) paraméterű, paritásbittel kiegészített Hamming-kódot használjuk. 
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4.130. feladat. Tisztán törléses hibát okozó emlékezetnélküli bináris csatornán 
p — 0.05 a törlés valószínűsége. 4 bites üzeneteinket paritásbittel bővített (7,4) 
Hamming-kóddal továbbítjuk. Elfogadhatóan választottuk-e a kódot, ha üzene- 
teinket legalább 0.999 valószínűséggel szeretnénk a vevőben helyesen rekonstru- 
álni? 


4.131. feladat. 18 bájt méretű üzenetcsomagjainkat 2 bájt méretű CRC-vel véd- 
jük egy p — 0.001 bithibázás valószínűségű emlékezetnélküli BSC csatornán. 


a) Tegyük fel, hogy zajmentes nyugtázócsatorna áll rendelkezésre, s a hibade- 
tekció tökéletes! Mennyi a csomagismétlések átlagos száma? 


b) Mekkora ugyanez a szám, ha a nyugtázó csatorna is ugyanilyen mértékben 
hibázhat, ahol az 1 bájt méretű nyugta szintén 2 bájt méretű CRC-vel vé- 
dett. Az adó csak akkor nem ismétel, ha hibátlan nyugta érkezik. Mennyi a 
csomagismétlések átlagos száma? 


4.132. feladat. p hibázási valószínűségű emlékezetnélküli csatornán N bájt mé- 
retű, T időtartamú csomagokat továbbítunk. A hibakontroll CRC alapú hibade- 
tekció. Az adó addig nem küldi el a következő csomagot, amíg az utoljára elkül- 
dött csomag sikeresen át nem jutott a csatornán, s erről a visszairányú csatornán 
nyugtát nem kapott. Tegyük fel, hogy a nyugtázás szintén 7 időt vesz igénybe. 
Mekkora a csomagkésleltetés várható értéke, ha a visszairányú csatorna hibamen- 
tes? 


4.133. feladat. Additív gaussi csatornán kommunikálunk, s modemünk E,/No 
jel/zaj viszony mellett p — e-£/Mo valószínűséggel hibázik. (7,4) paraméterű 
Hamming-kóddal szeretnénk hibát javítani. P,, — 1079 a megengedhető kódszó- 
hiba valószínűség. 


a) Mekkora jel/zaj viszony mellett érhető ez el, ha nem használunk kódolást? 


b) Tegyük fel, hogy 1 hibát javít dekóderünk, s több mint 1 hiba esetén érintet- 
lenül hagyja a vett szót. Mennyivel javul a jel/zaj viszony nyereség kódolás 
esetén? 


5. fejezet 


Kriptográfia 


A kriptológia a titkos illetve védett kommunikáció tudománya, amelynek két ága 
a kriptográfia és a kriptoanalízis. A kriptográfia azon algoritmikus módszerek- 
kel foglalkozik, amelyek biztosítják az üzenetek (tárolt információk) titkosságát, 
védettségét vagy hitelességét. A kriptoanalízis a titok — általában illetéktelen 
— megfejtésére (, feltörésére") tartalmaz eljárásokat. 


A kriptológia mint titkosírás és annak fejtése nagy hagyományokkal rendelke- 
zik, amely történeti előzményekkel kapcsolatosan [15]-ban találhatunk példákat. 


A kriptográfiával kapcsolatos nyilvános kutatások a "70-es évek közepétől 
egyre növekvő iramban folynak. Ennek fő oka az algoritmikus adatvédelem iránt 
a privát (nem katonai vagy diplomáciai) szektorban megnyilvánuló igény, amely- 
nek hátterében az áll, hogy napjainkban — különösen a fejlett hírközléssel rendel- 
kező országokban — , érzékeny információk", amelyek jogtalan megszerzése sú- 
lyos anyagi és erkölcsi károk okozására adhat lehetőséget, nagy mennyiségben ke- 
rülnek átvitelre nyilvános távközlési csatornákon, vagy tárolódnak fizikailag átla- 
gosan védett memóriákban. Gondoljunk például pénzügyi információkra, egész- 
ségügyi, életrajzi vagy személyi adatokra. 


Titkos információk védelmi rendszerének az algoritmikus módszerek általá- 
ban csak egyik pillérét jelentik, amelyek megfelelő fizikai valamint ügyviteli (in- 
formációkezelés rendszabályai) eljárások alkalmazásával együtt biztosítják a va- 
lóságos rendszerekben az információvédelmet. 


Az alábbiakban a kriptográfia elemeit taglaljuk, annak alapjaiba kívánunk be- 
tekintést nyújtani. 
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5.1. Alapfogalmak 


A digitális információforrás kimeneti adatfolyamából, az ún. nyílt adatból blok- 
kokat készítünk, amelyre az x — (x1,Xx2, . . . , xm ) jelölést alkalmazzuk, s amelyet 
nyílt üzenetnek (plaintext) hívunk. A titkosító kódoló egy egy-egy értelmű le- 
képezéssel ebből az y — (y1,y2, . .. ,Yw) titkosított (rejtett) üzenetet (ciphertext) 
állítja elő: 


y — Ex(x), 6.D 
ahol Ex, k — (ki, ka , . . . kg) paraméterű invertálható kódoló transzformáció. A k 


vektor a titkosítás kulcsa, az az információ, amely egyértelműen meghatározza az 
aktuális titkosító transzformációt. 
A titkosító dekódoló az inverz transzformáció, Dk felhasználásával 


x — Dx(y) (5.2) 


módon reprodukálja a nyílt üzenetet. 
Tekintsünk először néhány egyszerű példát. 


5.1. példa. Egy titkosító kódoló kimenetén az alábbi karaktersorozat jelenik meg 
az angol ábécé betűiből: 


AELIJEKELHMLMTOECHECPBMIBEOSKCDJ. 


ég át 


Betűnkénti helyettesítést alkalmaztunk az alábbi helyettesítő tábla felhasználásá- 
val: 


ABCDEFGHIJKLMNOPORSTUVWXYZ 
CIPHERABDFGJKLMNOOSTUVWXYZ" 


ahol egy felső sorbeli karaktert az alatta állóra cseréltünk ki. A nyílt és a rejtett 
üzenetblokk egy karakter hosszúságú, azaz M — N — 1. A helyettesítő táblát úgy 
konstruáltuk, hogy a második sorát egy értelmes szóval kezdtük (CIPHER), majd 
sorrendben felsoroltuk az ábécé fennmaradó karaktereit. A kulcs ez esetben az 


értelmes kezdőszó. A dekódolást a kulcs (és az annak megfelelő helyettesítő tábla) 
ismeretében elvégezhetjük, s az alábbi nyílt adatfolyamot kapjuk: 


GENTLEMEN DO NOT READ EACH OTHERS MALL. 


5.2. példa. A fenti példabeli nyílt szöveget bontsuk 8 karakteres blokkokra, majd 
kódoljunk blokkonként az alábbi permutáció felhasználásával: 


ge bő ÖLT 
"4 371825 6) 
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azaz az 1. pozícióban levő karaktert a 4. pozícióba, a 2.-ban levőt a 3.-ba, stb. 
helyezzük át. Ezzel az alábbi rejtett szöveget kapjuk: 


TNMGEELENORNEDOTAEOATDCHSRIHLEMA 


A dekódolás során az inverz permutálást végezzük el blokkonként. A kulcs ez 
esetben az aktuális permutáció. A helyettesítés mellett ezen ún. transzpozíció 
(vagy keverés) eljárás a másik alapmódszer blokk-kódolók készítésében, általában 
a kettőt kombinálva alkalmazzák. 


5.3. példa (Caesar-titkosító). A már Julius Caesar által is használt titkosító elve 
egyszerű. Az angol ábécé betűit feleltessük meg számoknak az A —0,B— l,... , 
Z —25 helyettesítéssel. Az x — (x1,Xx2, . . . , m ) nyílt szöveget az y — (y1,y2, . . .,YN) 
rejtett szövegbe karakterenkénti — a megfelelő egészeken végrehajtott — 


yi — x;-1-k; (mod 26), (5.3) 

i — 1,2,..., M modulo összeadással kódoljuk, ahol a k — (ki, ka, . . . kg) kulcs is 
a (0, 1, . . . 25 ) halmazból veszi az elemeit. 

Számpéldaként legyen k — (3,3, . . . , 3) konstans elemű vektor, továbbá M — 


7, s ekkor az x— (CAESARX) nyílt üzenetet az y — (FDHVDUA) rejtett üzenetbe 
kódoljuk. A dekódolás az 


x; —yi—k; (mod 26), 
i—- 1,2,...,M inverz művelettel történik. 


5.4. példa. Az 5.3. példa nyílt szövegének megfeleltetett decimális értékek biná- 
risba alakításával az alábbi bináris nyílt szöveget kapjuk: 


X — (00010,00000, 00100, 10010,00000, 10001, 10111) 


Legyen a kulcs egy a nyílt szöveggel azonos hosszúságú pénzfeldobás sorozat 
(fej-1, írás—0): 


k — (10011,10011,00100, 10111, 10010,00001,01110) 
és képezzük a rejtett szöveget az x és k bitenkénti modulo 2 összeadásával: 
y — (10001, 10011,00000, 00101, 10010, 10000, 11001) 


A dekódolás a kódolás inverze, azaz x; — y; — k; — (yi; --k;) (mod 2). 


320 5. KRIPTOGRÁFIA 






































X ) titkosító y titkosító ] X 
kódoló Ci " dekódoló 
k k 
kulcsforrás NDETSÉE ET DEEZTSE 
C2 


5.1. ábra. A konvencionális titkosító rendszer elvi vázlata. 


Az az eljárás, amikor k kulcsot minden egyes x kódolásakor függetlenül sor- 
soljuk, a bináris véletlen átkulcsolás (one-time-pad, ill. Vernam-titkosító néven 
is ismert), amely, mint látni fogjuk, elvileg tökéletes titkosító eljárás. 

Az eddigiekben bevezetett titkosítási módszer az ún. rejtett kulcsú, más né- 
ven konvencionális vagy egykulcsos blokk-kódolás. A konvencionális titkosító 
rendszer blokkvázlatszerű modelljét láthatjuk az 5.1. ábrán. 

A rejtett üzenetet a C1 nyilvános csatornán (public channel), míg a kulcsot a C2 
titkos csatornán (secret channel) továbbítjuk a dekódoló oldalra, tehát a kódolás 
és a dekódolás azonos titkos kulcsot használ. A csatorna nyilvánosságát illetve 
titkosságát egy támadóval szembeni korlátozott illetve tökéletes védettsége jelenti. 
Például közhasználatú hírközlési csatornáink nyilvános, míg egy megbízható futár 
általi kézbesítés titkos csatornának felel meg. 

A támadó (behatoló) célja lehet az x nyílt üzenet megállapítása vagy a k kulcs 
megszerzése. Alapfeltételezés a támadó ismereteivel kapcsolatosan, hogy az ak- 
tuális k kulcs kivételével a kódolás, dekódolás alkalmazott algoritmusát teljes 
részletességgel ismeri. (Titkosítási algoritmuson a titkosító kódolás és dekódo- 
lás számítási eljárását értjük.) Ez azt is jelenti, hogy egy titkosítási algoritmus 
által nyújtott védettség nem haladhatja meg a kulcsa védettségének mértékét. A 
kulcs az az információ, amely gyorsan és kívánatosan gyakran cserélhető, míg 
a titkosító rendszer többi elemét hosszabb ideig nem kell változtatni. A támadó 
által alkalmazható módszerek közül csak az algoritmikus támadási módszereket 
tekintjük. (Elképzelhetők további módszerek, pl. betörés, lefizetés alkalmazása, 
elektromágneses kisugárzás mérése is egy elszánt támadó részéről.) 

Az algoritmikus típusú támadásnak passzív és aktív módját különböztetjük 
meg, amelyet a nyilvános csatornán hajt végre a támadó. 

A passzív módszer az ún. lehallgatás, amikor a támadó a nyilvános csatornán 
áramló üzenetek sorozatának birtokába jut. A támadó célja az, hogy a megfi- 
gyelt rejtjelezett kapcsolatból kinyert információk felhasználásával algoritmikus 
támadást indítson az aktuális kulcs megállapítására. Ezt az eljárást szokás rejtjel- 
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fejtésnek nevezni, amelynek eszköztárát a kriptoanalízis módszerei alkotják. A 
rejtjelfejtő általában széleskörű háttérinformációra is alapozhat, mint pl. a nyílt 
szöveg nyelve, formátummegkötései, statisztikai tulajdonságai, tipikus szavai, ki- 
fejezései (gondoljunk pl. egy beszélt nyelven megfogalmazott táviratra, vagy egy 
számítógépes programra). Ezen háttérinformációk az éppen lehallgatott üzenetek- 
kel együtt képezik azt az információbázist, amelyekre alapozva egy rejtjelfejtési 
művelet sikeres lehet. Így anélkül, hogy bárki az aktuális nyílt szövegnek akár 
egy részletét is elárulná a támadónak, az nagy valószínűséggel tudhat egy rejtett 
szöveghez tartozó nyílt szöveget, vagy annak egy részletét. Az is lehetséges egy 
számítógépes rendszerben, hogy a behatoló képes a rendszer egyik nem rejtje- 
lezési védelmi vonala mögé kerülni (átlépve ügyvitel-kezelési rendszabályokat, 
fizikai védelmet), abból a célból, hogy kikényszerítsen általa választott nyílt szö- 
veghez tartozó rejtett szöveget. 

A passzív típusú támadásokat azok növekvő ereje szerinti sorrendben a követ- 
kező kategóriákba sorolhatjuk: 


a) Rejtett szövegű támadás (ciphertext only attack): támadás azonos kulcs- 
csal kódolt rejtett üzenetek birtokában, azaz a támadó rendelkezésére áll 
egy Ek(X1), Ek(x2), : . .  Ek(xL) sorozat, ahol k az aktuális kulcs. 


b) Ismert nyílt szövegű támadás (known plaintext attack): a támadó rendel- 
kezésére álló (Xi, Ek(xX1)), (x2, Ex(x2)), : : . (XL, Ek(xL) ) nyílt és rejtett üze- 
netpárok birtokában történő támadás. 


c) Választható nyílt szövegű támadás (chosen plaintext attack): támadás ab- 
ban az esetben, amikor a támadó szabadon választhatja meg azt a nyílt üze- 
netet, amelynek rejtett párját látni szeretné. Képzeljük például azt, hogy 
egy banki információs rendszerben valaki egy tranzakciót kezdeményez, 
azaz generáltat egy X1-et, és látja annak titkosított változatát EL (X-et is. 


d) Választható szövegű támadás (chosen text attack): támadás abban az eset- 
ben, amikor a támadó szabadon választhatja meg akár a nyílt üzenetet, akár 
a rejtett szöveget, amelynek párját látni szeretné. 


Aktív módszer a rejtett üzenetek csatornából történő kivonása, kicserélése, 
amelyek célja a hozzávetőlegesen ismert tartalmú rejtett üzeneteknek a támadó 
szempontjából kedvező módosítása (üzenetmódosítás). Egy másik aktív módszer 
az, amikor a támadó megpróbálja egy legális felhasználó szerepét eljátszani azért, 
hogy valamely másik legális rendszerelemtől információt csaljon ki (megszemé- 
lyesítés). 

A kétféle támadási módszert illusztráljuk az 5.2. és 5.3. ábrán. 
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5.2. ábra. Passzív támadás. 
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5.3. ábra. Aktív támadás. 


Egy üzenet titkossága (privacy) azt jelenti, hogy csak a legális (kívánatos) 
partner számára rekonstruálható annak nyílt tartalma, míg egy üzenet hitelessége 
(authenticity) azt jelenti, hogy azt olyan személy generálta, aki a kulcs legális bir- 
tokában van. Lényegében azt mondhatjuk, hogy a titkosság az üzenet tartalmával, 
míg a hitelesség az üzenetet küldő személlyel kapcsolatos. Szemléletes példával 
illusztrálva: ha a postás felbontja a levelet, akkor annak tartalma már nem titok, 
de ha a levél tartalmát nem módosítja, s úgy kézbesíti, az üzenet hiteles marad. 

Azt mondjuk, hogy a támadó feltörte a titkosító algoritmust, ha , gyorsan" 
meg tudja állapítani egy lehallgatott üzenet nyílt tartalmát, függetlenül attól, hogy 
éppen melyik kulcsot alkalmazzák. A gyorsaság olyan időintervallumot jelent, 
amelyen belül a támadó sikeresen használhatja céljaira a megszerzett információt. 

A titkosítási algoritmusok célja a passzív támadások sikerének megakadá- 
lyozása. Az aktív típusú támadásokat algoritmikus eszközökkel nem akadályoz- 
hatjuk meg, de megfelelő kriptoprotokollok alkalmazásával a támadást észlelhet- 
jük. A protokollok általában véve egy előre meghatározott üzenetcsere folyama- 
tot jelentenek, amelyet kettő vagy több partner bonyolít le kooperatívan valamely 
feladat végrehajtására. A kriptoprotokollok elemként alkalmazzák a titkosítási 
algoritmust, s biztosítják a kapcsolat védett felépülését, a kommunikáció alatti 
aktív támadások észlelhetőségét, összességében garantálják a partnerek és üze- 
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netfolyamataik hitelességének ellenőrizhetőségét. A titkosítási algoritmusok és a 
protokollok a kriptográfia tudományának két fő ágát jelentik. 

A konvencionális titkosítási algoritmusok mellett a "70-es évek végétől kez- 
dődően rohamosan fejlődik a nyilvános kulcsú titkosítási algoritmusok családja, 
amelyeket a továbbiakban még részletezni fogunk. Megemlítjük továbbá, hogy a 
blokktitkosítás mellett létezik az ún. kulcsfolyamatos titkosítás (stream ciphers), 


amelyet ezen bevezető ismeretanyagban nem részletezünk [40]. 


5.2. A konvencionális titkosítók analízise 


Az információelméleti eszközöket alkalmazó alábbi analízisben azt tételezzük fel, 
hogy csak rejtett üzenetek állnak az analízis rendelkezésére, vagyis a rejtett szö- 
vegű támadást vizsgáljuk. 

Jelölje X és K a nyílt üzenet és a kulcs valószínűségi változókat, amelyek egy 
realizációja XxX és k az aktuálisan kódolandó nyílt üzenet és az alkalmazott kulcs. 
Feltesszük, hogy X és K független valószínűségi változók. Az (5.1) leképezésnek 
megfelelően Y — Ek(X) a rejtett üzenet valószínűségi változó. 


5.1. definíció. Tökéletes titkosításról akkor beszélünk, ha 
I(X;Y) —0, (5.4) 


azaz, ha X és Y kölcsönös információja nulla, amely ekvivalens az X és Y való- 
színűségi változók függetlenségével, és azzal, hogy a passzív tánadó egy olyan 
csatorna kimenetét látja, amelynek csatornakapacitása nulla (a csatorna zaja csak 
ak kulcstól függ). 


5.1. tétel. Tökéletes titkosítás létezik. 
BIZONYÍTÁS: Tekintsük az 5.4. példa algoritmusát: 
Y-X-K, (5.5) 


ahol Y — (Y1,Y2, tébző ,YN), X — (X1,.X2, El XN), K — (Ki, Ka , EREZÓ , KN) bináris vek- 
torok és koordinátánként modulo 2 összeadást végzünk. Legyen K egyenletes 
eloszlású a bináris V-dimenziós vektorok halmazán, ekkor 





Pf(Y—-—y]X-xl P(X3IK-—-yIX-xj—- 
—- P(K—y-xIX-xj— 
— P(K-y-x)- 

1 

DN 
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ahol felhasználtuk X és K függetlenségét. Innen 


P(Y-y) — 9)P(Y-yIX-xJP(X-xj— 
X 
1 
Eli 
— Pf(Y-yI[X-x) 
adódik, azaz Y és X függetlenek. HI 


Érdemes észrevenni, hogy X és Y függetlenségéhez nem kellett semmit fel- 
tételezni az X eloszlásáról, továbbá, hogy a rejtett üzenet valószínűségi változó 
is egyenletes eloszlású lesz. Azonban ahhoz, hogy a szóban forgó (Vernam) tit- 
kosító realizálható legyen, minden egyes üzenet kódolásához új kulcs szükséges. 
Így az adási és vételi oldalon nagy mennyiségű kulcsot kellene tárolni vagy egy 
védett csatornán továbbítani. Pontosabban a szükséges kulcsbitszám azonos az 
átküldendő nyílt adatfolyam bitjeinek számával. 

Az alábbi tételből világossá válik, hogy ez a hátrány minden tökéletes titkosí- 
tóra fennáll. 


5.2. tétel. Tetszőleges tökéletes titkosító algoritmus esetén 
H(K) 2 H(X). (5.6) 
BIZONYÍTÁS: (5.4) felhasználásával azt kapjuk, hogy 


H(X) — H(XIY) 4 I(X;GY) — H(XIY), 


továbbá 
H(XIY) c HX,K]Y) — 
— H(K]Y)3H(XIY,K) — 
H(KIY) c 
S H(K), 


ahol felhasználtuk az X — DK(Y) alapján fennálló 
H(XIY,K)—0 
egyenlőséget. ha 
Az 5.2. tétel felhasználásával bináris esetben a 


H(X) S H(K) — H(Ki,K2,...,Kw) S IK], (5.7) 
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azaz a H(X) 2 IKI egyenlőtlenséget kapjuk. Tehát bináris tökéletes titkosító al- 
goritmus esetén legalább annyi bináris digitből kell állnia a kulcsnak, amennyi 
információs bitet hordoz a nyílt üzenet. 


5.2. definíció. Minimális tökéletes titkosító algoritmusról beszélünk, ha 
IKI— [/(X) 1, 6.8) 
ahol [v] a v valós szám felső egész részét jelöli. 


Az (5.7) és (5.8) formulák alapján látható, hogy a kulcsméret csökkentése 
érdekében adattömörítés szükséges, vagyis az, hogy a Se arány minél közelebb 
essen az 1-hez. Ideális tömörítést és Vernam-titkosítást alkalmazva minimális 
tökéletes titkosítót készíthetünk, hiszen ekkor 


IKIM—N s H(X) (5.9) 


állna fenn. Ezért kell az üzenetet először tömöríteni, és utána titkosítani. 
Shannon vezette be a gyakorlati titkosság és a feltétel nélküli titkosság fogal- 
mát. 


5.3. definíció. Egy titkosítási algoritmust gyakorlati titkosságot nyújtónak ne- 
vezünk, ha feltörése irreálisan nagy számítási / tárolási kapacitást kíván. 


5.4. definíció. A feltétel nélküli titkosság azt jelenti, hogy a megszerezhető in- 
formáció (pl. rejtett üzenetek sorozata rejtett üzenetű támadást tekintve) meny- 
nyisége elvileg sem elegendő a feltöréshez bármekkora számítási kapacitás is 
állna rendelkezésünkre. 


Az 5.1. definíció szerinti tökéletes titkosító feltétel nélküli titkosságot biztosít. 
Adott algoritmusok számításigényének elméleti meghatározását egy rohamosan 
fejlődő tudományág, az algoritmusok komplexitáselmélete tűzte ki célul. Ezen 
eredmények alapján egyes nyilvános kulcsú titkosító algoritmusok feltörhetőségét 
bebizonyították. 

Az alábbiakban bevezetésre kerülő nyilvános kulcsú titkosítási algoritmusok 
gyakorlati titkosságot kívánnak nyújtani. Az algoritmusok alapja tipikusan egy 
közismerten igen nehéz matematikai probléma, a tárgyalandó RSA-algoritmus 
például az igen nagy (x 1099) egészek prímfaktorokra bontásának nagy számítás- 
igényére alapoz. 
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5.3. Nyilvános kulcsú titkosítás 


A nyilvános kulcsú titkosítás alapgondolata, hogy gyakorlati titkosságot tud 
nyújtani anélkül, hogy a titkos üzenetküldést megelőzően a kommunikáló partne- 
rek bármiféle titkos kulcsot cseréltek volna egymással, mint ahogy ez az előzetes 
kooperáció előfeltétel a konvencionális titkosítás esetén. Az A nyilvános kulcsú 
titkosító két kulccsal dolgozik, egy nyilvános (k/) és egy titkos (k5) kulccsal. A 
nyilvános kulcsot a kódoláshoz, a titkos kulcsot a dekódoláshoz használjuk. Ha A 
és B titkosítók felhasználásával történik titkos üzenetváltás, akkor B az 


y— E (x) 


rejtett üzenetet küldi A-nak, amit kf nyilvánossága miatt megtehet, s ebből a rejtett 
üzenetből 


x — Dx (9) 


dekódolással nyeri vissza A a nyílt üzenetet. A kódolás a nyilvános kulcs isme- 
retében , könnyű" feladat, míg a dekódolás a rejtett kulcs ismeretének hiányában 
gyakorlatilag nem végrehajtható (, nehéz feladat"). 

Egy A, B, C, . . . titkosítókat (felhasználókat) tartalmazó rendszerben egy nyil- 
vános kulcstárba tesszük le a kf, k8, . . . nyilvános kulcsokat, ahonnan bármelyik 
felhasználó kiolvashatja annak a felhasználónak a nyilvános kulcsát, akinek rejtett 
üzenetet kíván küldeni. 

Az egyes felhasználók helyben generálhatják a (k.k) kulcspárt, s ebből a 
nyilvános részt közzéteszik, míg a másikat titokban tartják. Nagyon fontos ész- 
revennünk azt a kitételt, miszerint a nyilvános kulcstárból csak olvasni szabad, s 


Fr 4 


védeni kell azt a nyilvános kulcsokkal történő manipulációktól (pl. cserétől). Ez 
azt jelenti, hogy ugyan a kommunikációt megelőzően nem kell titkos kulcscserét 
végezni, hiszen a nyilvános kulcstárból olvasás egy nyílt előzetes információcse- 
rének felel meg, de megmarad az a feladat, hogy ezen nyílt előzetes információ 
hitelességét biztosítani kell. 

Hitelesítési feladatban jól alkalmazható a D dekódoló transzformáció. Te- 
gyük fel, hogy A az x üzenetet kívánja B-nek elküldeni olyan módon, hogy egy- 
úttal , aláírását" is elhelyezze a rejtett üzenetben. Ezt úgy teheti meg, hogy az 
y — Eg(DA(x)) alakú üzenetet küldi el. y alapján a DA(Xx) tartalmat csak B tudja 
dekódolni, s nyilván D4(x) az a leképezés, amely egyértelműen kapcsolódik a 
küldő személyéhez, A-hoz, és a küldött üzenethez, x-hez. A dekódoló transzfor- 
mációnak a nyílt üzenetre történő alkalmazásával digitális aláírást generálhatunk. 
Hasonló aláírások hitelesíthetik a nyilvános kulcstár elemeit. Ezen alkalmazá- 


sokra a kriptográfiai protokollok kapcsán még visszatérünk. 
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A. Shamirtól származik az a rendkívül érdekes eljárás, amelynek a felhaszná- 
lásával mindennemű előzetes kulcscsere nélkül titkos üzenetváltás történhet part- 
nerek között, feltéve az esetleges behatolóról, hogy passzív, azaz a csatornán fo- 
lyó üzenetváltás lehallgatására képes csak. Ez az eljárás elvi továbblépést jelent a 
nyilvános kulcsú algoritmusokkal szemben is, hiszen még nyilvános információt 
sem kell előzetesen a partnerek tudomására hozni. 

A felhasználók mindegyike egy titkos kulccsal rendelkezzen, s tegyük fel, 
hogy a rendszerben alkalmazott Ek(x) kódoló transzformáció kommutatív, azaz 
tetszőleges x nyílt üzenet, ka és kg kulcspár esetén 


Ek, (Ekx (x)) — Ekz (Eka (x)) , (65.10) 


azaz a kétszeres kódolás eredménye független legyen a kulcsválasztás sorrendjé- 
től. Ekkor az ún. , háromlépéses" eljárás alkalmazásával A felhasználó B-nek a 
következőképp küldheti el x üzenetét: 


1. AB: yi-—-Ek(R) 
2. BO A:  y2— Exg(Exa(x)) — Ex, (Ekp(x)) 
3. AG B: y3 — Dr, (Ekg (Eka (x))) - Exx(x) 


Ez a természetes ötlet még szemléletesebben is leírható. Nevezetesen képzel- 
jük el, hogy egy lelakatolható ládába helyezi el A az x üzenetet, s lelakatolja k4 
kulcsával (1. lépés), majd elküldi B-nek. B nem próbálkozik a nyitás számára is 
lehetetlen feladatával, hanem inkább még a saját kg kulcsával is lelakatolja a ládát 
(2. lépés), majd visszaküldi azt A-nak. A leveszi a saját lakatját, s a ládát, amelyen 
már csak B lakatja maradt, visszaküldi B-nek (3. lépés), aki ezután már könnyen 
kinyithatja azt. 

A fentiekből úgy tűnhet, hogy megtaláltuk a tökéletes megoldást, hiszen való- 
ban nem kellett előzetes kulcscsere a partnerek között (sem nyilvános, sem titkos). 
De mint említettük, ezen protokoll praktikus alkalmazhatóságát az gátolja, hogy 
teljesen ki van szolgáltatva az aktív támadásnak, hiszen az üzenetküldés nyilvános 
hálózaton történik. A fenti szemléletes leírásmód szóhasználatával gondoljunk 
csak arra, hogy pl. a postás, akivel a ládát kívántuk B-hez eljuttatni a saját lakatját 
teszi a ládára a 2. lépésben, s így adja azt vissza A-nak. 

Az (5.10) kommutativitási tulajdonságnak eleget tesz az egyszerű 


Ex(x) —x-ik (mod2) 
bitenkénti modulo 2 vektorösszeadást alkalmazó kódolás, ugyanis 


(x1-k4) 23-kp s I(x--kz) 73-ka] (mod 2), 
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mivel a mod 2 összeadás asszociatív. 

Könnyen beláthatjuk azonban, hogy ezen kódolás alkalmazása a háromlépéses 
eljárásban még a legegyszerűbb passzív támadásnak, a pusztán rejtett szövegre 
alapozó támadásnak sem áll ellen. Ugyanis az eljárás 1., 2., 3. lépése során a 
támadó megfigyelve az 


y1—x-ka, . yo—xtkatksg,  y3—x-7-ke 
rejtett üzeneteket, és képezve azok mod 2 összegét, 


yi ty2ty3—x, 


az x nyílt üzenethez jutunk, sőt a kulcsok is kinyerhetők: kg — y1 4-y2 és ka — 
y2 ty3. Vegyük észre, hogy az alkalmazott kódolás nem véletlen átkulcsolás, 
hiszen kétszer is alkalmaztuk ugyanazon kulcsot. 

Kommutatív egy x" mod n alakú kódolás (modulo hatványozás) is, ahol x, e,n 
természetes számok, azaz 


(x1)2 — (x2)"! mod n. 


Ilyen típusú műveletet használ az 5.4. szakaszban részletesen kifejtett RSA-kódo- 
lás. 


Elemi számelméleti eredmények 


Ahhoz, hogy megérthessük a Rivest-Shamir—Adleman (RSA) algoritmus mű- 
ködését, néhány elemi számelméleti eredmény felidézése szükséges. 


5.3. tétel (A maradékos osztás tétele). Tetszőleges a és b, b 5 0 egészekre egyér- 
telműen létezik g és r egész, hogy 


a—bgi-r, 0£r cb. 


BIZONYÍTÁS: A létezés könnyen látható, hiszen a gb £ a a (g1-1)b egyenlőt- 
lenségnek eleget tevő egészet választhatjuk, s ekkor r — a— gb. Az egyértelmű- 
ség igazolásához tegyük fel, hogy g, r páron kívül létezik d", r" pár is, amelyre a — 
gbi-r", 0£r! c b. Mivel ekkor gb tr — gb--r" állna fenn, ezértr—r! — b(g"—g) 
átrendezéséből ellentmondásra jutunk, hiszen 0 £ rr! c b miatt r—r! c b, s 
ugyanakkor teljesülnie kell a b ][ r—r! oszthatóságnak, ami csak r — r! esetén 
lehetséges. Az r — r! egyenlőségből viszont g — d" is következik. h. 
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5.5. definíció. Az a számot a b és c szám közös osztójának nevezzük, ha a [ b 
és a [ c teljesül. Ha b és c közül legalább az egyik nem nulla, akkor a közös 
osztóik legnagyobbikát b és c legnagyobb közös osztójának nevezzük és (b,c)- 
vel jelöljük. 


5.6. definíció. Azt mondjuk, hogy a és b relatív prímek, ha (a,b) — 1. 
5.4. tétel (Az euklidészi algoritmus). Adott b és c 5 0 egészekre egymás után 


többször alkalmazzuk a maradékos osztást, s ezzel az egyenletek következő soro- 
zatát kapjuk: 


b—-cgi-ri 0Ocrac 

c—rig2 tr? 0 Cr. Cr 

ri —rog3-tr3 0 €r3 ar? 
Tn—2 — Fn—1dn 1 Fn 0 Crna rni 
rn—-1 — Fndny1t0 0—-rnyi 


A b és c számok legnagyobb közös osztója rn, az osztási eljárás legutolsó nem 
nulla maradéka, azaz (b,c) — rn. 


BIZONYÍTÁS: 


a) ri,r2,... pozitív egészek szigorúan monoton csökkenő sorozata, ezért lé- 
teznie kell olyan egésznek, amelyre rn4.1 — 0. 


b) A b — cag1 --ri egyenletre tekintve láthatjuk, hogy ha x I b és x ] c fennáll, 
akkor x [ri is fenn kell álljon, s viszont, ha y ] c és y I ri, akkor ebből 
y ]5is következik. Ez pedig azt jelenti, hogy b, c közös osztóinak halmaza 
megegyezik c,ri közös osztóinak halmazával, ezért (b,c) — (c,r1) is igaz. 
Az euklidészi algoritmus további egyenleteit is tekintve a 


(b,c)— (c,r1) — (ri,r2) — tt — (rni, Fn) — (rn,0) — rn 


egyenlőségi láncot kapjuk, tehát (b, c) — rn valóban igaz. hJ 


5.1. következmény. Tetszőleges b és c egészekre, amelyek közül legalább az 
egyik nem nulla, léteznek s és t egészek, hogy 


(b,c) — sb 7-tc. 6.11 
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BIZONYÍTÁS: Az euklidészi algoritmus egyenleteiből egymásba helyettesítések- 
kel a következő egyenletsort kaphatjuk: 


r —- b-—-agcn-bi(—ag)c 
r. — c—geri —(—dg2)b1-(1--gi1g2)c 


ra — sbi]-tc, 


tehát az összes r;, így rn is felírható a b és c számok lineáris kombinációjaként. Mi 


5.5. példa. Határozzuk meg a 8387 és 1243 legnagyobb közös osztóját! 
Az euklidészi algoritmus alapján: 


8387 — 1243.6-4-929 
1243 929.1-4314 
929 314.2--301 
314 — 301-1-£13 
301 — 13.232 
13 2.671 

2 — 1.240, 


így (8387, 1243) — I, azaz relatív prímek. Ezen számolást felhasználva az (5.11) 
előállítás a következőképp kapható b — 8347, c — 1243 jelölésekkel: 


929 — b-—6c 
314 — —bi4T7c 
301 — 35b—20c 
13 — —4b-427c 
2 — 95b—641c 
— —574b-43873c, 


azaz (8387, 1243) — —574- 8387 43873 - 1243. 


5.7. definíció. Ha az m nem nulla egész osztja az a — b különbséget, akkor azt 
mondjuk, hogy az a kongruens b-vel modulo m, és ezt a következőképpen jelöljük: 
a—b (mod m). 
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5.8. definíció. Azt mondjuk, hogy b modulo m inverze a-nak ha 
ab—1 (modm). 


5.6. példa. Az 5.5. példa alapján a 3873 az 1243 modulo 8387 inverze, hiszen 
3873 1243 —1 mod 8387. 


5.5. tétel. Az a modulo m inverze akkor és csak akkor létezik, ha (a,m) — 1. Ha 
létezik inverz, akkor az egyértelmű az m-nél kisebb pozitív egészek között. 


BIZONYÍTÁS: Ha létezik b, amelyre ab — 1 (mod m), akkor az ezzel ekviva- 
lens ab — gm — 1 alakból (a,m) ] 1, azaz (a,m) — 1 következik. Megfordítva, 
ha (a,m) — I, akkor az (5.11) felhasználásával sa --tm — 1 kapható, ahol b — s 
választással ba — —tm-- 1, azaz ba — 1 (mod m) következik. 

Az egyértelműséget a következőképp bizonyíthatjuk. Haa b £b,0 c b, 
b" a m egészekre ab — ab" — 1 (mod m), akkor a(b — b") — 0 (mod m), ami azt 
jelentené, hogy m ] a(b — b"). De mivel (a,m) — I, ezért ebből m ] b — b" követke- 
zik, ami viszont [b — b"]  m miatt lehetetlen. h 


5.6. tétel (Fermat-tétel). Ha a c egész nem osztható a p prímmel, akkor 
cP-!—-1 (mod p). (5.12) 


BIZONYÍTÁS: Tetszőleges c egészre a c, 2c, 3c, . . . , (p— 1)c számok különböznek 
modulo p. Ha ugyanis ic — jc (mod p), i Z j, 0 ci, j C p fennállna, akkor 
az (i— j)c — gp és li— jl € p, pt c összefüggésekből ellentmondásra jutnánk. 
Így tehát a c,2c,...,(p— 1)c számok modulo p az 1,2,...,p— 1 számok egy 
permutációját adják. A kongruencia definíciójából következik, hogy ha a; — b; 
(mod p), i — 1,2,.. . ,n, akkor a1az . . .an — bib2...bn (mod p) is fennáll. Tehát 
1-2.3....-(p—1)—c:2c:3c-...:(Dp—1)c, azaz 


p-l p-1 
[I[7- cp-! I [7 (mod p) 
i—I i—I 


fennáll, ahonnan 
1—cP-! (mod p). H 


5.7. tétel (Fermat-tétel általánosítása). Ha pi és pa különböző prímek, és 
(a, pi1p2) — 1, akkor 


a(pr-Dw2—-0) —1 (mod pip2). (5.13) 
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BIZONYÍTÁS: Az (a,pip2) —1 a pita és p2 1 a állításokat jelenti, így mivel 
Pi és pa prím, pit ap?! és po taPrr! is teljesül. A Fermat-tétel felhasználásával 
tehát 


—1 
(al) " ) —1 (mod p1) 


e] 
(ap) 7 ! s] (mod P2) 


következnek. De ha valamely c egészrec — 1 (mod p1), c— 1 (mod p2), akkor 

az ekvivalens pi Ic— 1 és pa ] c— 1 állításokból pipa ] c— 1 következik. A c — 

alpi-1(r2—1 megfeleltetéssel a tétel bizonyítását kaptuk. HI 
Az 5.6. és 5.7. tételek az alábbi tétel speciális esetei: 


5.8. tétel. Ham — p1p2 : : : Pn, ahol p1 , pa , . . . , Pn különböző prímek és (a,m) — 1, 
akkor 
ad(m —1 (modm), (5.14) 


ahol do(m) — (p1—1)(p2— 1) :::(pn— 1) az Euler-függvény. (Ez a tétel az Euler- 
tétel speciális esete.) 


A továbbiakban csak az 5.7. tétel általánosságára lesz szükségünk, ezért az 5.8. 
tétel bizonyítását (lásd [34]), amely az 5.7. tételéhez hasonlóan történhet, el- 
hagyjuk, s csak a d(pip2) — (pi — 1)(p2 — 1) rövidített jelölést használjuk. Az 
eddigiekben bevezetett számelméleti alapok birtokában megérthetjük az RSA- 
algoritmust. 


5.4. RSA-algoritmus 


Az algoritmus lépései a következők: 
1. Válasszunk véletlenszerűen két nagy prímszámot p1-et és D2-t. 


2. Kiszámítva az m — pip2 és d(m) — (pi —1)(p2 — 1) paramétereket, válasz- 
szunk véletlenszerűen egy e, 1 £ e — d(m) egészet úgy, hogy 


(lm) — 1 (5.15) 
teljesüljön. 
3. Számítsuk ki e inverzét modulo d(m): 
d-e! (modod(m)) (5.16) 


(az 5.5. tétel miatt létezik). 
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4. Az m,e egészeket nyilvánosságra hozzuk, míg a d, p1 , Da értékeit titokban 
tartjuk (azaz k? — (m, e), k" — (d, p1,D2)). 


5. A titkosító kódolás az 1 £ x a m nyílt üzenetre egy 1 £ y am rejtettüzenetet 
ad, ahol 
y—-x!" (modm), (5.17) 


míg a dekódolás az 
d 


x-y  (modm) (5.18) 
inverz művelet. 


(Az x és y skalár jelölést alkalmazzuk a nyílt ill. a rejtett üzenetre az RSA esetén, 
kihangsúlyozandó, hogy nemnegatív egész számokként végezzük velük a mod m 
műveleteket.) 


5.1. lemma. Az (5.17) és (5.18) formulákkal megadott műveletek egymás inver- 
Zel. 


BIZONYÍTÁS: Mivel (5.16) a de — gd(m) -- 1 állítással ekvivalens valamely g 
egészre, ezért az 


yi szt (x2)" pemany; xed jemzr xd0(m)--1 (mod m) 


kongruencia láncolatot kapjuk. Külön vizsgáljuk az (x,m) — 1 és (x,m) 5 1 ese- 
teket. 


a) (x,m) — 1 esetén (5.13) felhasználásával x9V0 — 1 (mod m), így 
yi — xadlm-1 — (xdm a —x (mod m) 
azaz ez esetben a kívánt eredményt kaptuk. 


b) (x,m) 5 1 esetén mivel m — pipa és x — m, ezért vagy pi ] x vagy p2 ] x. 
Az általánosság korlátozása nélkül feltehetjük, hogy pi [ x, ezért x — wpi 
felbontás kapható, ahol (w,m) — 1. 


Ennek felhasználásával 
xdm) wáolm)-HL pzdlm)H1 (mod m). (5.19) 


Mivel (w,m) — 1, ezért (5.19) jobb oldali első tényezőjére az 5.7. tétel fel- 
használásával 
widímr —w (modm) (5.20) 
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adódik. A Fermat-tétel felhasználásával: 


8 s agy 4(pi-1) 
gs ag (y ) szijji ber 9) — pi (modp2) (5.21) 


illetve nyilvánvalóan: 


pot -0— pi (mod pi) (5.22) 


1) 


Így mivel pi I pam) j — pi és (5.21) alapján p2 ] potlm) 1 — pi teljesülnek 


a pi A pa prímekre, ezért pi p2 je] — pi 1s fennáll. Azaz 
ZEGA S BÜS — pi (modm). (5.23) 
Az (5.20) és (5.23) eredményeket (5.19)-ben felhasználva 
xdm —wpj—x (modm) 


adódik, amit bizonyítani szerettünk volna. HI 


Az alábbiakban egy számpéldával szemléltetjük az RSA-algoritmus paramé- 


terszámítását (1—4. lépések), majd a kódolás és a dekódolás műveletét, amelyben 
a számok nagyságrendjét a lépések szemléltetéséhez kicsire választottuk. 


5.7. példa. Legyen pi — 73, pa — 151, így m— 73-151 — 11023, d(m) — 
(73—1)(151—1) — 10800 — 2$.3-52-9. Az e paramétert választhatjuk pél- 
dául 11-re, mivel (10880,11) — 1. Az e inverzét modulo b(m) az (5.11) alak 
segítségével állíthatjuk elő, azaz az 5.5. példában látott számításmenetet követve 


24 


kaphatjuk meg az es 1-b(m)t — 1 előállítást: 


10800 —-— 11-981£9 


11 — 9.172 
9 — 2.441 
2 — 1.2-0, 


ahonnan 


9 — 10800—981.11 
2 — 11—9—11—(10800—981-11) — —108003-982-11 
9—2.-4—10800—981-11—4-(—108003-982.11) — 
5: 10800 — 4909 . 11, 
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így —4909-11— 11 (mod 10800), ezért d — 10800 — 4909 — 5891 (mod 10800), 
tehát d — 5891. 

Nyilvánosságra hozzuk az e — 11 ,m — 11023 egészeket, s titokban tartjuk a 
pi1-—T3,p2 —151,d — 5891 egészeket. 

Tegyük fel, hogy az x — 17 nyílt üzenetet kívánjuk kódolni, ekkor 


y—-17" (mod11023), 
ahonnan y — 1782. A dekódolás az 
x — 178259! (mod 11023) (5.24) 


művelettel történik. 
Az (5.24) modulo hatvány kiszámítását egyszerűsíti a gyorshatványozás (, négy- 
zetre emelés és szorzás") módszere. A kitevőt az 


FELEDI DK 2S 492242 12 


összegre bonthatjuk a bináris ábrázolása alapján. Ennek alapján az (5.24) hatványt 


24 44Z 


az alábbi alakba célszerű átírni: 


IZB2Z ÁLT SD ZÉTBZ AZA TSZ ÍTSL S 
— ((...(1782)7)71782)21782)21782)7)7)7))?)P)782)21782 
A kiértékelést a legbelső modulo négyzetre emeléssel kezdjük, azaz az első né- 
hány lépés: 
17827 —900 (mod 11023) 


9007 — 5321 (mod 11023) 
(5321 - 1782) — (224292 —76 (mod 11023), 


s az utolsó lépés eredményéül a 17-et kapjuk vissza. Így ahelyett, hogy (5.24) 
mechanikus kiszámításához, azaz a 


((...(1789 : 1789) : 1789) : 1789) . . ..) -1789 


szorzáshoz szükséges 5890 darab modulo szorzást végeztük volna el, megúsztuk 
17 darab modulo szorzással. (Könnyen ellenőrizhető, hogy ezzel a módszerrel 
legfeljebb a kitevő kettes alapú logaritmusának kétszerese számú modulo szor- 
zásra van szükség.) 
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Az egyirányú függvény 


Mai ismereteink szerint e és m nyilvános adatok birtokában az 
f:(1,2,....m—1)—7o (1,2,....,m—1h 


f(x)—x" (modm) (5.25) 


inverzének kiszámítása (azaz egy y értékhez egy, az y — f(x) (mod m) összefüg- 
gésnek megfelelő x meghatározása) számításigényét tekintve gyakorlatilag meg- 
oldhatatlan feladat, ha a pi és pa prímeket elegendően nagyra választjuk. Erős 
sejtés, hogy ezen inverzképzés nehézsége ekvivalens az m prímfaktorokra bontá- 
sának nehézségével. További sejtés, hogy egész számok faktorizálására szolgáló 
algoritmusok felhasználásával ma számításigényét tekintve megoldhatatlan fela- 
dat a logigm — 300 nagyságrendű egészek felbontása. Mai ismeretek és techno- 
lógia alapján többszáz év nagyságrendű idő lenne szükséges a számításhoz. Ezen 
időtartambecslést természetesen elsősorban úgy kell tekintenünk mint egy irreá- 
lisan nagy értéket, amely szemlélteti a gyakorlatilag biztos védettség eléréséhez 
szükséges erős túlméretezést a kriptográfiai kódtervezésben. 

A gyakorlati titkosságra visszatérve, elvileg nyilván mód lenne e, m nyilvános 
adatok birtokában az összes fínyílt üzenet, rejtett üzenet) pár előzetes kiszámítá- 
sára, amelyeket tárolva és a rejtett üzenetek valamilyen sorrendjében felsorolva, 
tetszőleges rejtett üzenet vételekor kiolvashatnánk a nyílt párját. A feltétel nélküli 
titkosság így nyilván nem állhat fenn, hiszen az megengedné akár az összes ilyen 
pár tárolását és mégsem juthatnánk közelebb a titok (kulcs) megfejtéséhez. 

Az (5.25) modulo hatványozás a fentebb már említett megfelelő paraméter- 
nagyságrendek mellett egy példája az úgynevezett egyirányú függvényeknek. 


5.9. definíció. Az invertálható f függvényt egyirányúnak nevezzük, ha értelme- 
zési tartományának tetszőleges x elemére f(x) értéket könnyű kiszámítani, míg 
gyakorlatilag irreális feladat tetszőleges y értékkészletbeli elemhez az y — f(x)- 
nek megfelelő x kiszámítása. 


Az RSA-kódolás esetén könnyű feladatnak számít az (5.25) kódolás, míg a 
dekódolás csak a titkos dekódoló kulcs, d ismeretében könnyű. Azon egyirányú 
függvényeket, amelyeket egy információ birtokában könnyű, de annak hiányában 
gyakorlatilag lehetetlen invertálni csapda típusú egyirányú függvényeknek nevez- 
zük. Ezzel a szóhasználattal élve csapda típusú egyirányú függvény birtokában 
elvileg tervezhetünk nyilvános kulcsú titkosító algoritmust. Megjegyezzük, hogy 
a " 70-es évektől kezdődően rengeteg erőfeszítés történt ilyen függvények konstru- 
álására, amelyek közül eddig csak a modulo hatványozáson alapuló RSA-kódolás 
maradt feltöretlen. 
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Prímek előállítása 


Visszatérve az RSA-algoritmus első lépésére, nézzük meg röviden a vélet- 
len prímválasztás kérdését. Bizonyítás nélkül utalunk a számelmélet Csebisev- 
tételére [30], amely kimondja, hogy II()-re, az n pozitív egésznél kisebb prímek 
számára a következő becslés adható, ha n elég nagy: 


n 


II(n) 5 — 5.26 
n) Inn Kés 

Említettük, hogy ma teljesen biztonságos az m — pipa — 1099 nagyságrend, 
amelyhez p; — 109 (s 259), i — 1,2 nagyságrendű prímeket választottunk. Így 
annak a valószínűsége, hogy egy véletlenszerűen választott 259! c s ca 292 (502 
bites) szám prím, az (5.26) alapján közelíthető: 


[I (22) —II (2) va 289 OTT TASI 1 
2502. 2501 ön 2501 da 3507 





s mivel az adott számtartomány fele páros szám, amelyek nem prímek, elég csak 
a páratlanok közül válogatnunk, s ezzel megduplázzuk a találási valószínűséget 
gi Tz Te. Így tehát átlagosan 175 próbálkozásonként jutunk prímszámhoz a 10159 
nagyságrendű számok között. 

Felmerül a kérdés, hogyan dönthetjük el, hogy a véletlenül kisorsolt egész 
szám prím-e vagy sem. Véletlenül sorsolt számok közül a prímek valószínűségi 
alapon történő kiszűrésére több algoritmus is létezik, amelyeknek az alapelvét 
kívánjuk itt elmondani. 

Tegyük fel, hogy az s egészről szeretnénk eldönteni, hogy prím-e. Válasszunk 
egy úgynevezett bázist, egy b egészet a 2 a b — s tartományban. A Fermat-tétel 


alapján tudjuk, hogy ha s prím, akkor 
b! —1 (mod 5). (5.27) 


Így, ha 
b! 41 (mod 5), (5.28) 


akkor s biztosan nem prím, és b az s összetettségének ún. Fermat-tanúja. Azonban 
ha (5.27) igaz, akkor csak annyit mondhatunk, hogy lehetséges, hogy s prím. 

Ha a fenti tesztet r-szer egymás után megismételjük, és a függetlenül sorsolt 
2 2 bi1,...,br C s bázisok mindegyikére (5.27) teljesül, akkor az s egészet kis 
tévedési valószínűséggel prímnek nyilvánítjuk. Az ellenőrzések r számát nyilván 
úgy szeretnénk beállítani, hogy a tévedés valószínűsége (nem prím elfogadása) 
minél kisebb legyen [38, 31]. 
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Közös modulus választásának hibája 


Tegyük fel, hogy az RSA-kódolást alkalmazzuk egy sokfelhasználós rend- 
szerben, és egy p1, pa prímpárt választunk véletlen szelekcióval a teljes rendszer 
számára a kulcskiosztó központban. Ekkor az m — Dp1 : p2 modulus is közös a rend- 
szerben. Az egyes felhasználóknak a központ függetlenül sorsolja az eA , eg, ec, . . . 
nyilvános kódoló paramétereket, majd kiszámolja a megfelelő dA , dp , dc, . . . titkos 
dekódoló paramétereket. A nyilvános paramétereket nyilvános, olvasható kulcs- 
tárban helyezzük el. Amikor egy új felhasználó a rendszerhez kíván csatlakozni, 
ezen igényével — a rendszeren kívül — egy kulcskiosztó központhoz fordul, ahol 
egyrészt bejegyzésre kerül, másrészt megkapja a titkos kulcsát. A közös modulus 
(m) választásának előnye lehetne, hogy a nyilvános kulcstárban kevesebb ada- 
tot kell tárolni (azaz nem kell a különböző ma , mg, mc, . . . modulusokat tárolni), 
továbbá elképzelhető, hogy azonos modulus az aritmetika hardver megvalósításá- 
ban is egyszerűsítést eredményez a felhasználói eszközben. Az alábbiakban egy 
példán keresztül megmutatjuk, hogy közös modulus választásával súlyos rend- 
szertervezési hibát követnénk el, amelyre egy példát mutatunk. További példa 
található [31] irodalomban. 


Relatív prím kódoló kulcspár esete 
Abban az esetben, ha A és B felhasználók eA és eg kódoló kulcsa relatív prím és 
azonos nyílt tartalmú üzenet érkezik mindkét felhasználóhoz (pl. egy C felhaszná- 
lótól egy körlevél), akkor ezen üzenetet a támadó dekódolni képes anélkül, hogy 
ez egyben az RSA-kódolás megtörését (azaz m faktorizálását) jelentené. 
Legyenek ya — x"4 (mod m) és yg —x"B (mod m) a támadó által megfigyelt, 
azonos nyílt üzenethez tartozó rejtett üzenetek. Ha (e4 , eg) — 1, akkor az 5.4. tétel 
következménye alapján léteznek olyan t, s egészek, hogy t :- ea 4-s :eg — 1 fennáll. 
Mivel eA4 5 0 és eg 5 0, ezért t és s egyike negatív. Legyen t — 0, azaz t — —1 - [z]. 
Feltehetjük, hogy (va, m) — (yg,m) — 1, hiszen ellenkező esetben yA és n (illetve 
yB és m) legnagyobb közös osztója a pi vagy p2, aminek megismerése a titkosító 
transzformáció (RSA-kód) feltörését jelentené. Ha pedig (ya,m) — 1, akkor ya 
(mod m) inverze (y7 ") létezik, ahonnan 


04) a (yp)" — (XA) . (x6B)" — xteatsés —x (modm), 


azaz anélkül, hogy feltörte volna a támadó az RSA-kódot, képes volt kiszámítani 
a rejtett üzenet nyílt tartalmát. 

A fentiekben elmondott algoritmikus támadás konklúziója az, hogy közös mo- 
dulus választását mindenképpen el kell kerülni RSA-kódra alapuló rendszerekben. 
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A kicsi kódoló kulcsok problémája 


Az RSA-algoritmus paramétereinek megválasztásánál a kódoló e kitevőjére 
az 1 £ e a b(m), és (b(m), e) — 1 megkötéseket tettük. Kisebb számításigényű a 
kódolás, ha e értékét kicsire választjuk, és ezt megtehetjük, mivel ezen választás 
— a mai ismeretek szerint — nem könnyíti meg az RSA-algoritmus feltörhetősé- 
gét. Ha azonban egy sokfelhasználós rendszerben kicsire (például tíznél kisebbre) 
választjuk valamely felhasználó e paraméterét, az bizonyos körülmények között 
nyílt üzenet kiszámítására adhat lehetőséget a tánadó számára anélkül, hogy fel- 
törné a titkosító kódot. 

Itt felelevenítjük a kínai maradéktételt, amely a kódoláselméletben széleskör- 
ben alkalmazható. 


5.9. tétel (kínai maradéktétel). Ha az mi, ma , . . . mr pozitív egészek páronként 


relatív prímek, és a1 , aa , . . . , ar tetszőleges egész számok, akkor az 
x—a; (mod m;), tie ese 


kongruenciarendszernek van közös megoldása. Bármely két megoldás kongruens 
modulo mij - m2 - : :m,.. 


BIZONYÍTÁS: Ham — mi - m; : : -m,, akkor 78 egész és moj — 1. Ezért 
az 5.5. tétel értelmében léteznek olyan b ; egészek, hogy mb j— 1 (mod m;). Mi- 
vel m; ] aj ezért mjD j— 0 (mod m;), hai - j. Ha az xy egészet a következőkép- 
pen definiáljuk: 


am 
xi — ) —bjaj, (5.29) 
j- j 
azt kapjuk, hogy 
vi 
XI — ) E bja;j - E bia; — di (mod m;), 


j—1 mij Mm; 


azaz xi közös megoldása a kongruenciáknak. Ha xi és x2 mindketten megoldá- 


sai az x — a; (mod m;), i — 1,2, . . . " kongruenciáknak, akkor nyilván xz — x2 
(mod m;), i— 1,2,...,r. Azaz m; [ (xx —x2), i— 1,2, . . . ,r, amiből az (m;,mj) — 


1, i A j feltétel miatt m ] (xi — x2) következik, így xi — x2 (mod m). 


Ha egy sokfelhasználós rendszerben kicsi az a tartomány, amelyből az e ki- 
tevőket választjuk, akkor előfordulhat, hogy több felhasználó ugyanazt az e ki- 
tevőt kapja, de természetesen függetlenül választják a prímpárt, így különböző 
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dekódoló kulcsok és modulusok tartoznak hozzájuk (pl. okulva a közös modu- 
lus választásának következményeiből). Tegyük fel ekkor, hogy egy felhasználó az 
(e,m1) , (e,m2), . . . , (e, m,) nyilvános kódolási paraméterekkel rendelkező r (r 2 e) 
számú különböző felhasználónak ugyanazt az x üzenetet küldi, s a támadó rendel- 
kezésére állnak a megfelelő: 


yi — ax" (modmi) (5.30) 
y2 — x" (mod m2) 
yr — x! (modm,) 

rejtett üzenetek. Ha mi , m; , . . . , my relatív prímek, akkor a kínai maradéktétel fel- 


használásával kiszámíthatja az x" (mod mim) : : -m, ) hatványt. Mivel x € miním;t 
miatt 
0 ax" a mim2 : mp, 


ezért magát az x" hatványt (és nem csak modulo ekvivalensét) ismeri, így in- 
nen már x értékét is kiszámíthatja. Ha azonban az üzenetküldő az üzenet kül- 
dési időpontját is elhelyezi az üzenetben (időpecsét), akkor az azonos x üzenetet 
a ti , b, . . . ty küldési időpontok módosítják, s különböző kódolandó nyílt üzene- 
tekké válnak. 


5.5.  Kriptográfiai protokollok 


Algoritmikus szempontból egy titkosító rendszer két fő komponenst tartalmaz: 
egyrészt a titkosító kódoló és dekódoló transzformációkat, másrészt kriptográfiai 
protokollokat. A protokoll algoritmikus lépések sorozata két vagy több résztvevő 
partner között valamely feladat végrehajtása céljából. 

Szükségesek olyan szabályok, amelyek biztosítják, hogy a titkosító transzfor- 
mációk egy adott alkalmazásban a megkívánt titkosságot vagy hitelességet nyújt- 
sák. A transzformáció többnyire egy kulcsot használ, de a transzformációt vég- 
rehajtó algoritmus nem gondoskodik e kulcs védett célbajuttatásáról (kulcskiosz- 
tás), a tárolás ideje alatti algoritmikus védelméről (pl. hitelességének biztosítása). 
Aktív támadások ellen egy titkosító transzformáció önmagában nem véd, így meg- 
felelő szabályokkal kell gondoskodni az üzenetek támadó általi manipulációjának 
(blokkok nyilvános csatornából történő kivonása, vagy helyettesítése) felfedhető- 
ségéről. Protokollok felhasználásával történik a kommunikáló partner hitelessé- 
gének megállapítása, az illetéktelen megszemélyesítés felfedése is. A legerősebb 
titkosító transzformáció sem nyújt védettséget egy hibásan tervezett protokollkör- 
nyezetben. 
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A kriptográfiai protokollok az algoritmusok igen széles családját foglalják 
össze. A gyakorlatban leginkább alkalmazott, alapvető protokollok a következő 
csoportokba sorolhatók: 


e partnerhitelesítés 
e kulcskiosztás 

e üzenetintegritás 
e digitális aláírás 
e titokmegosztás 


Megjegyezzük, hogy számos további speciális célú, gyakorlatban kevésbé hasz- 
nálatos protokoll is ismert. 


Partnerhitelesítés 


A jelszavas partnerhitelesítés a legelterjedtebb, régóta ismert azonosítási el- 
járás. Hosszú idő telt el Ali Baba jelszavától a banki PIN kódokig. A jelszó 
egy titok, amit a felhasználó megoszt azzal az , erőforrással", amihez alkalman- 
ként hozzá szeretne férni. A jelszavas rendszerek szokásos problémái: a nem 
megfelelő jelszóválasztás, a jelszó nyílt alakban történő továbbítása a rendszerbe 
jutás pontjától (pl. terminál klaviatúra) az ellenőrzés pontjáig (pl. gazdagép), a 
jelszavak nem eléggé védett tárolása (mind a felhasználó oldalán, mind pedig a 
jelszófájl tekintetében). 

A jelszóellenőrzés folyamatát láthatjuk az 5.4. ábrán. A jelszavak gazdagép 
oldali védelmén javít azok egyirányú függvénnyel történő leképezése. Ekkor a 
jelszófájl az egyirányú leképezés eredményét tárolja az egyes felhasználókra, a 
felhasználói azonosítókkal (ID) együtt. A jelszó (P) továbbra is nyílt alakban ér- 
kezik az ellenőrzés helyére, ahol előbb kiszámításra kerül annak egyirányú függ- 
vényes leképezése (f(P)), majd ennek eredménye kerül összevetésre a táblázat 
bejegyzésével. 

Ezzel a megoldással tehát a jelszófájl illetéktelen olvasása önmagában nem 
jelent veszélyt, hiszen az egyirányú leképezés gyakorlatilag invertálhatatlan tu- 
lajdonsága biztosítja, hogy jelszóhoz a támadó nem férhet hozzá. Ez utóbbi ki- 
jelentés azonban csak feltételek mellett igaz: a jelszóméret legyen elég nagy a 
teljes kipróbálás megakadályozásához, a jelszavak a teljes jelszótérből kerüljenek 
kiválasztásra. 

A nem megfelelő jelszóválasztás azt jelenti, hogy a felhasználók nem vélet- 
lenszerűen választanak az adott hosszúságú alfanumerikus karaktersorozatok kö- 
zül, hanem pl. értelmes szavakat, jellemző dátumokat, ezek triviális kombinációit 
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igen/nem 





jelszó 
P . tábla 
(ID1, f(P1)) 
(DI, f(P1)) 

















ID 














5.4. ábra. Egyirányú jelszóellenőrzés. 


használják. Ezért a szótár alapú támadások jelentős százalékban sikerre vezethet- 
nek. 


Az egyszer használatos jelszó 

Ha a jelszót kapcsolatfelvételenként változtatnánk, nyilván semmi értelme nem 
lenne a jelszó megismerésére irányuló támadásnak, feltéve, hogy a korábbi jel- 
szavakból nem számítható ki a következő jelszó. Ekkor tehát az aktuális jelszót 
nyíltan is átküldhetjük. Egy változó jelszavas protokoll az alábbi: 


Inil. A: r generálása 
Ini2. AG B: IDA ny—f/(r) 
1.  AGB: PP. —f7I(r) 


11 B: y—- f(P)? 
2. AGB: P—-f72f(r) (5.31) 
21 B: y- f(P)? 


ha AZERI P,—-f7i(r) 
il B: y — fi(P)? 


A protokoll inicializálásakor egy r titkos véletlen elemet A felhasználó az f 
egyirányú függvény n-szeri alkalmazásával leképez, amelynek y eredményét küldi 
át B-nek, aki ezt tárolja. Az i-edik bejelentkezéskor használandó P; jelszó y in- 
verze az f/ egyirányú függvényre vonatkozólag. Ezt az inverzet csak A képes ki- 
számítani, de a számítás helyességét (miután f nyilvános) bárki képes ellenőrizni 
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az f i-szeri alkalmazásával. Az inverz leképezés praktikus futásidejű algoritmu- 
sát természetesen maga A sem képes előállítani, azonban erre nincs is szüksége, 
mivel az r véletlen elem f függvénnyel történő n — i-szeres leképezése ugyanerre 
vezet. A két félnek szinkront kell tartani a jelszósorszám vonatkozásában. Ha 
azonban valamely hiba következtében az átvitel során elveszne egy jelszó, ak- 
kor A eggyel továbblép a jelszósorszámban, és új jelszót küld, mellette jelezve az 
egylépéses szinkronhibát. 


Partnerhitelesítés nyilvános kulcsú függvények felhasználával 
Tekintsük a következő, , kihívás és válaszvárás"? (challenge £ response) típusú 
partnerazonosítási protokollt, amelyben B kívánja A-t azonosítani: 


1. BOA: R 
2. AG B: y—-DA(R) (5.32) 
3. B: R — E4(y)? 


A protokoll biztonságosnak tűnik, hiszen A nem játszhat vissza korábban fel- 
vett 2. lépésbeli üzenetet, továbbá csak A képes y előállítására a titkos dekódoló 
kulcsának használatával. A protokoll tehát jónak tűnik, pedig nem feltétlenül az, 
s ez a véletlen elemre adott dekódolási lépéssel kapcsolatos: 

Tegyük fel, hogy a leggyakoribb nyilvános kulcsú rejtjelező algoritmust, az 
RSA-t kívánjuk használni. Tegyük fel továbbá, hogy C lehallgatott egy korábbi, A 
számára küldött y — E4(x) —x" mod n rejtjelezett blokkot, ahol e az A nyilvános 
kulcsa az RSA-algoritmusnak megfelelően. C az x üzenetet szeretné megtudni, 
amit közvetlenül kiszámítani nem tud, hiszen x — yi mod n, és a d kitevő az A 
titkos kulcsa. 

C a következő ravasz módon jár el. Választ egy R véletlen természetes számot, 
ahol R c n és (R,n) — 1, majd a következő előkészítő számításokat végzi el: 


v-R" modn 


w-vy modn 
t—R"! modn 


Ezután C elküldi w-t A-nak aláírásra. Itt kapcsolódunk vissza az (5.32) proto- 
kollhoz, ugyanis legyen az (5.32) protokollbeli véletlen elem w, amit C küld A-nak 
, kihívásként" az 1. lépésben. Az (5.32) protokoll 2. lépésében A egy dekódolási 
lépést hajt végre, azaz visszaküldi a B-t megszemélyesítő támadónak az 


u—wi modn 
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értéket, ami már lehetővé teszi C számára, hogy megtudja mi is volt az x üzenet, 
ugyanis: 
tu—R"!wi — R-!ydyi v-dydyd szei yi —-x modn, 


ahol felhasználtuk, hogy R— vi mod n. 
A következő, módosított változat már biztonságosabb, ahol továbbra is B kí- 
vánja A-t azonosítani: 


1. BOA: R; 
2. AG B: DA(R1), Aja B: z - DA(Ri ER) (5.33) 
3. B: R1 ER; — E4(z)? 


24 


C nem tud A-tól egy általa előállított R2 blokkra dekódolást kérni, mivel A 
csak egy általa módosított Rj E R2 blokkra alkalmazza a dekódoló transzformá- 
ciót. Másfelől C nem tudja A-t megszemélyesíteni, mivel ehhez a friss R2 véletlen 
blokkot kellene neki R1 véletlen blokkon keresztül úgy manipulálnia, hogy a 2. lé- 
pésben korábbi üzenetek visszajátszásával csalhasson. Erre azonban nem képes, 
mivel az R1 blokkot is dekódolt formában kell küldenie. 

Ezen módosítás után C már nem képes megszemélyesíteni A-t, mivel nem 
tudja végrehajtani az 2. lépést, illetve ha az a 2. lépésben egy dedódolás nélkül 
egy véletlen elemet küld át B-nek, akkor nem tudja a 3. lépést elvégezni. Ha A 
is azonosítani kívánja B-t, akkor ugyanezen protokollt lejátsszák fordított szerep- 
osztással. 

Elkerülhető a fenti támadás olyan módon is, hogy rejtjelezésre és azonosításra 
más kulcskészletet használunk. 


Kulcskiosztás 


A konvencionális kódolók közös titkos kulcsot használnak. A jó kulcs valódi 
véletlen bináris vektor, amelyet nyilván nem lehet szinkronban generálni. Tehát 
az azt generáló féltől védetten át kell juttatni a partnerhez. A védelem jelenthet 
fizikai védelmet (például kulcsszállító hardverben , kézben" visszük át a kulcsot 
a partnerhez), illetve tisztán algoritmikus védelmet, amikor a kulcsot rejtjelezve 
nyilvános kommunikációs csatornán továbbítjuk. Ezen szakaszban a tisztán algo- 
ritmikus módszerekkel foglalkozunk. A konvencionális kódoláson alapuló rejt- 
jelezés ma is alapvető módszer, miután a nyilvános kulcsú, rejtjelezés céljára is 
alkalmas algoritmusok kódolási sebessége sok alkalmazásban nem elegendően 
nagy. 


Kulcskiosztás konvencionális algoritmussal 
A rendszer A, B, C, . . . felhasználói konvencionális titkosítással kívánnak üzene- 


5.5. KRIPTOGRÁFIAI PROTOKOLLOK 345 





központ 




















5.5. ábra. Kulcskiosztás központ felhasználásával. 


teket váltani egymással. Feltesszük, hogy a felhasználók kötődnek egy-egy ter- 
minálhoz és közülük tetszőleges pár tud egymással kommunikálni. A rendszer 
rendelkezik egy kulcskiosztó központtal, amely lehet egy, a terminálok által elér- 
hető számítógép. A további magyarázatot segíti az 5.5. szemléltető ábra. 

A protokoll a következő: 


A a Kp ; IDA ID8,R1 

Kp A: Erx,(Ri,IDg,DK,Erx,(DK IDA)) 

Aa B: Erxkz(DK IDA) (5.34) 
B—7 A: Epk(R2) 

Aa B: Epk(R2 —1) 


eáösaztá See dei 


A protokoll kétféle kulcsot használ: a felhasználói terminálkulcsokat (T KA , 
T Kg, . . .)) és a kapcsolatkulcsot (DK). 

Az R! és R? véletlen elemek használatának oka a visszajátszásos támadás (rep- 
lay attack) megakadályozása. Egy ilyen támadásban a C támadó egy korábbi, 
rögzített üzenetet próbál újrahasználni. 

Ha tehát a 2. lépésben A felé az üzenet nem a központtól, hanem C-től szár- 
mazna, ezt A rögtön észrevenné, hiszen nem az 1. lépésben általa elküldött vélet- 
len elemet tartalmazná a 2. lépésben megkapott üzenet. 

Ha pedig C küldené el A nevében az 1. lépésbeli üzenetet, akkor — nem is- 
mervén a T KA kulcsot — nem tudná dekódolni a 2. lépésben vett üzenetből a DK 
kapcsolatkulcsot. 

Ha C a B-t próbálná megszemélyesíteni, nyilván nem tudná dekódolni a 3. 
lépésbeli üzenetet. 

Ha C az A-t próbálná megszemélyesíteni, s a 3. lépéssel indítva egy régebbi 
3. lépésbeli üzenetet kíván elküldeni B felé, akkor miután a DK kulcsot ebből 
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dekódolni nem tudta, nem lesz képes a 4. lépésbeli , friss kihívás" 5. lépésbeli 
megválaszolására. 

A 3—655. lépések után B azt tudja, hogy olyan féllel áll szemben, aki ismer 
egy , valamikor" A-nak küldött DK kapcsolatkulcsot. A protokoll nem gondosko- 
dik arról, hogy A meggyőződjön B azonosságáról, hiszen R2 véletlen blokk lévén, 
az nem ellenőrizhető, hogy a 4. lépésbeli rejtett üzenet valóban egy véletlen blokk 
rejtjelezésével állt elő. A protokoll hátránya még, hogy megbízható központ lé- 
tére támaszkodik, ami nemcsak annak többlet infrastrukturális kiadását jelenti, 
de annak a veszélyét is, hogy a központ üzemképtelensége vagy sok kérés miatti 
leterheltsége az egész rendszer üzemképtelenségéhez vezet. 

A protokoll leginkább kifogásolt , gyenge" pontja az, hogy régi, a C támadó ál- 
tal időközben megismert DK kulcs felhasználható támadásra. A támadást C a pro- 
tokoll 3. lépésétől kezdi, s láthatóan B szemében A felet sikeresen megszemélye- 
sítheti (vegyük észre, hogy az Erx, (DK, ID4 ) korábbi lehallgatott üzenetet komp- 
letten használhatja fel). Ezen támadással szemben megerősíthető a protokoll, 
ha a központ Erx, (DK, IDA) helyett egy időpecséttel ellátott Erx,(DK,IDA,T) 
protokoll-elemet állít elő. Az időpecsét azonban az üzenetcsere gyakoriságoknak 
megfelelő pontos órát tételez fel, amely biztonságos is abban az értelemben, hogy 
egy C támadó azt nem képes állítani. 

A rendszer üzembe helyezése előtt megfelelő védelmi rendszabályok betar- 
tása mellett kerülnek elhelyezésre a mester és terminálkulcsok. A központ mester- 
kulcsával kódolva átlagosan védett tároló közegen (pl. diszk) tárolhatja az egyes 
terminálok kulcsait (Ewk(T KA ) , Euk(T Kg) , . . ). A mester- és terminálkulcsokat 
kulcs titkosítására, a kapcsolatkulcsot a nyílt adatfolyam titkosítására használják. 
A legnagyobb védettséget a mesterkulcs igényli, viszonylag a legkisebbet a kap- 
csolatkulcs kapja, azaz a mesterkulcs helyezkedik el a kulcshierarchia tetején. A 
kapcsolatkulcsok kerülnek leggyakrabban felhasználásra. A hierarchiában alsóbb 
szintű kulcs kompromittálódása felsőbb szintre nem hat, fordítva viszont igen, 
hiszen a terminálkulcs megszerzésével dekódolhatjuk az oda érkező kapcsolat- 
kulcsot. 

Az (5.34) protokoll véletlen elemeket használ a régebben felvett protokoll- 
részletek visszajátszásával történő támadási kísérletek megakadályozására. Al- 
kalmazhatnánk időpecséteket is védelemül. Az (5.34) kulcscsere protokoll idő- 
pecséteket alkalmazó alábbi változata a kulcscsere és azonosítás kettős feladatot 
kívánja megoldani. A javított protokoll az alábbi lépésekből áll: 


AGKp: IDA DB 
Kp— A: Erx.(T,L,DK,IDB),Erx,(T,L,DK,IDA) 
AB: EpkíT IDA Er (TE. DK IDA) 

B7 A: Epk(T" 41) 


(5.35) 


bezztttó asölőt Szdsz 
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A fenti lépésekben 7 a DK kulcs előállításának időpontja, L pedig a DK kulcs 
élettartama. A 2. lépésben megkapott kódolt üzenetből A megállapíthatja, hogy az 
órája szerinti időpont belül van-e a [7,T -- L] intervallumon. Ugyanezt megteszi 
B is a 3. lépés után. A 3. lépésbeli Epk(T", IDA) protokoll-elem küldése egyrészt 
azért szükséges, hogy B meggyőződhessen arról, hogy ezen lépésbeli átvitelt va- 
lóban A végzi (vegyük észre, hogy az 1—2. lépésig egy C támadó is eljuthat), 
másrészt A T" friss elemmel kihívást is küld egyúttal B felé. Az utolsó lépés az A 
felet győzi meg arról, hogy partnere valóban B. 

Az ilyen, órát feltételező protokollok ki vannak téve annak a veszélynek, hogy 
az órák pontos együttfutása (szinkronizáltsága) valamilyen rendszerbeli hiba vagy 
szándékos beavatkozás miatt megszűnik. Ha a küldő órája siet a vevő órájához 
képest, egy C támadó, lehallgatva az üzenetet, azt egy visszajátszó támadásban 
felhasználhatja. 


Kulcskiosztás nyilvános kulcsú algoritmussal 

A , támadó középen"? támadás a kulcscsere vonatkozásában azt jelenti, hogy a 

támadó A és B legális felek közé áll, azok kezdődő kulcscsere protokolljába meg- 

próbál bekapcsolódni oly módon, hogy észrevétlenül rávegye a legális feleket egy 

általa is ismert kulcs használatára. Ezen támadásnál tehát nem a támadó kezde- 

ményezi a kulcscserét, hanem szinkronban belép A és B beszélgetésébe. 
Tekintsük az alábbi protokollt: 


AG B: IDA,kA CA 

B-OA: IDR,kB, CB 

A— B: Ep(R1) (5.36) 
BO A: EA(R2) 

A,B : k — F(R1,R2) 


szeszt vanát taal 33 


ahol CA és Cg a kA és kg nyilvános kulcsok tanúsítványai (certificate), azaz az adott 
nyilvános kulcsokra egy központ által előállított digitális aláírások. Ezen aláírást 
a központ (IDA, kh együttesére adja. A központ nyilvános kulcsát a rendszer 
minden résztvevője ismeri. Az F leképezés szerepe annak biztosítása, hogy a k 
kulcs létrehozásában mindkét fél , egyforma mértékben" vehessen részt, így pél- 
dául választható az R1,R2 véletlen bináris vektorok koordinátánkénti modulo 2 
összeadása. 

Ha a protokoll 1. és 2. lépésében nem kerülne átküldésre a hiteles kulcstanú- 
sítvány (CA, CB), akkor a nyilvános kulcsokat egy középen álló támadó sikerrel 
manipulálhatná általa is ismert kapcsolatkulcs megbeszélésére. 

Kommutatív egyirányú függvényre is építhető kulcscsere protokoll. Az egyik 
legismertebb kommutatív egyirányú függvény a diszkrét hatványozás. Ha csak 
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passzív támadásra kell felkészülni, akkor bárminemű kulcscsere illetve központ 
segítsége nélkül képes két fél — A és B — arra, hogy közös véletlen elemet, azaz 
közös kapcsolatkulcsot , megbeszéljen". 

Válasszunk egy , nagyméretű" véges testet, jelölje ezt GF(g), jelölje g ennek 
egy — nem titkos — primitív elemét. A protokoll a következő: 


1. AG B: g" 

2. BOoA: geg? 

3. A: (g?2)Ri 
B : MET 


(5.37) 


Mivel a hatványozás kommutatív művelet, ezért a k — (g?2)Ri — (gRi)?2 közös 
kulcsban állapodhat meg a két fél. Az átviteli csatornában hallgatózó C támadó 
nem képes az Ri illetve R2 véletlen elemeket megállapítani, mivel a diszkrét loga- 
ritmusképzés nehéz feladat. A C támadó ugyanakkor képes a , támadó középen" 
aktív támadásra. Az A féllel a fenti protokoll szerint megbeszél egy k4 kulcsot, B 
féllel egy kg kulcsot, majd összekapcsolja őket olyan módon, hogy konvertálja a 
rejtett üzeneteket az egyik kulcsról a másikra az üzenet irányának megfelelően. 


Üzenethitelesítés 


Az üzenethitelesítés feladata az, hogy a vételi oldalon detektálhatóvá tegyük 
azon eseményeket, amelyek során az átviteli úton az üzenet valamilyen módosu- 
lást szenvedett el. Az alábbiakban a legfontosabb módszerek közül a 


e kriptográfiai ellenőrző összeg (MAC) 
e rejtjelezés 

e digitális aláírás 

e hash függvény 


alapú protokollok alapelveit mutatjuk be. 


Kriptográfiai ellenőrző összeg (MAC) alapú üzenethitelesítés 

Konvencionális blokk-kódolót alkalmazunk. Tegyük fel, hogy az üzenet r számú 
blokkra bontható: xi , . . . , x.. Ha az utolsó blokk töredék lenne, egészítsük ki zéró 
bitekkel teljes blokkra. Blokk-kódolónkat CBC (rejtett blokk láncolás) módban 
használva kriptográfiai ellenőrző összeget (MAC, Message Authentication Code) 
állítunk elő, s ezt a nyílt alakú üzenethez fűzve továbbítjuk a csatornán, azaz a 
továbbított hitelesített üzenet: 


[X1. . . . , Xr, MAC(X1 , . .  ,Xp))] 
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inicializáló blokk 


: 












































N bites 
regiszter 
szél sellI. 5 m bit 
üzenek SZ kiválasztása MAC 
blokkok j 
kulcs 


5.6. ábra. MAC generálás. 


Az eljárást szemléltetjük az 5.6. ábrán. Formálisan MAC — g(y,), ahol y,. az 
yi — Ex (Xi OVi 1), Tel seat 


rekurzió r-edik lépésbeli eredménye, továbbá yo — / (inicializáló blokk). A g 
függvény y, N bitjéből m bitet választ ki, s az eredmény a kriptográfiai ellen- 
őrző összeg. A vételi oldal megismétli az MAC számítást, s az eredményt ösz- 
szehasonlítja a vett MAC-vel. Egyezés esetén fogadja el hitelesnek a vett üzene- 
tet. 

Az m értékét akkorára kell választani, hogy elhanyagolható legyen annak a va- 
lószínűsége, hogy a C támadó az [x1, . . . , xr, MACCx , . . . ,xr)) hitelesített üzenetet 
[41 - . . , X45 MACCO , . . . ,x4.) ] hiteles formátumú üzenetre cserélje, ahol [44 , . . . , x..] 
a támadó céljainak megfelelő csaló üzenet. Mivel a titkos k kulcsot nem ismeri, 
azaz MAC számításra nem képes, ezért támadása akkor lehet csak sikeres, ha ki- 
sorsolva egy v m bites vektort, véletlenül v — MAC(34 , . . . , x, ) egyenlőség fennáll. 
Az inicializáló blokk lehet nyilvános az adott CBC módú alkalmazásban. Ennek 
megfelelően választhatjuk például a csupa zéró blokkot. 


az ég 


Konvencionális rejtjelezéssel történő üzenethitelesítés 

Ha konvencionális rejtjelezést alkalmazunk egy nyílt üzenetre, és rejtjelezett for- 
mában küldjük el a vételi oldalra, nyilván csak a titkos kulcs birtokában levő, 
jogosult vevő képes annak tartalmát olvasni. Ezzel tehát a hitelesítési feladatot 
is megoldottuk, ha a nyílt üzenet redundáns, valamely strukturával vagy formá- 
tummal, amelyet a vevő kriptográfián kívüli , eszközzel" ellenőriz. Ha valamely 
nyelven írott szöveg a nyílt üzenet, akkor ez az , eszköz" az adott nyelven olvasni 
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tudó ember olvasási képessége. Ha azonban a nyílt üzenet strukturálatlan folyam 
(legalábbis a rendelkezésre álló , eszközeink" számára), akkor önmagában a rejt- 
jelezés nem ad lehetőséget üzenethitelesítésre. A strukturálttá tétel egyik legegy- 
szerűbb módja valamely lineáris ellenőrző összeg (MDC, Manipulation Detection 
Code) alkalmazása, s a nyílt szöveg ezen összeggel történő kiegészítése. Ez lehet 
például az adatátvitelben jólismert ciklikus redundancia karakter (CRC) képzése. 

Összegezve: a rejtjelezéssel történő hitelesítés ötlete az, hogy a dekódolt üze- 
net struktúrája megtörjön egy aktív támadás esetén. (Pl. írott szöveg vagy részletei 
véletlenszerűvé válnak, beszéd részletei zajjá válnak, stb.) 

Sajnos ezzel még nem oldottuk meg megnyugtatóan a feladatot. A gondot 
az jelenti, hogy a nyílt üzenet tipikusan sokszorta hosszabb, mint a konvencioná- 
lis blokk-kódoló blokkmérete, azaz tördelni kell a nyílt üzenetet, s blokkonként 
kódolni. Ezt azonban nem mindegy hogyan tesszük, ha üzenetmódosító táma- 
dásra is gondolnunk kell. Nyilván veszélyes lehet az, ha az xy, . . . , x, nyílt üzenet 
blokkokat külön-külön rejtjük (ECB, Electronic Code Book), mert az eredményül 
kapott yi, . . . , vr rejtett blokkok sorozatának egyes elemei észrevétlenül kihagyha- 
tók, korábbira kicserélhetők, duplikálhatók lehetnek a nyílt üzenet struktúrájától 
függően. Ezért alkalmazzuk a láncolás módszerét, így a rejtett blokk láncolás 
(CBC, Cipher Block Chaining) módot. Az 5.6. ábrának megfelelő elrendezést 
tekintsük ismét, elhagyva a kimeneti m bitet kiválasztó elemet. Az / inicializáló 
blokkot azonban ezesetben körültekintően kell kezelni, hogy egy támadási lehe- 
tőséget megakadályozzunk. A láncolás első lépése ugyanis 


yi — Ex(x1 €1), 


következésképpen ha C támadó az !/ blokkot tetszőleges /" blokkra tudja módosí- 
tani, akkor tetszés szerinti x blokkra módosítható az xi első nyílt blokk, miköz- 
ben x el! — xi el fennáll, azaz az y1 első rejtett szöveg blokk nem változik. § 
mindezt a kulcs ismerete nélkül teheti meg. Hogy ezt a támadását véghezvigye, 
el kell érnie, hogy a legális vételi oldalon /" inicializáló blokkot alkalmazzanak 
a dekódolás során. Ha tehát a vételi oldali dekódoló eszköz nem tulajdonít nagy 
jelentőséget az / blokk módosítás elleni védelmének, akkor ezzel potenciális tá- 
madásra ad lehetőséget. Tehát elvileg nem baj, ha az inicializáló blokkok tára 
, bárki" által olvasható, de fontos, hogy ne legyen illegálisan írható, azaz hiteles 
maradjon. 


Digitális aláírással történő üzenethitelesítés 

A konvencionális rejtjelezők alkalmazásával történő üzenethitelesítés (MAC il- 
letve CBC módú rejtjelezés) csak a két fél számára ad lehetőséget a hitelesség 
megállapítására. Így nyilván hiába mutat fel egy bíróság előtt például B fél egy 
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konvencionális rejtjelezésű üzenetet azt állítva, hogy azt A küldte, akivel közös 
titkos kulcsuk volt. A bíróság számára ez nem bizonyíték, hiszen B maga is előál- 
líthatta azt. Van azonban olyan módszer, amivel detektálhatóvá tehetünk üzenet- 
módosító támadást, s ugyanakkor egy harmadik fél felé is bizonyítékul szolgálhat. 
A módszer a digitális aláírást használja, amelyre a következő pontban térünk visz- 
sza. 


Üzenethitelesítés titkos kulcs nélkül 

Meglepő módon, egyirányú lenyomatkészítő függvény, azaz hash függvény fel- 
használásával titkos kulcs nélkül is oldhatunk meg üzenethitelesítési feladatot. 
Ekkor a titkos kulcsból illetve a nyílt üzenetből képzett kriptográfiai ellenőrzőösz- 
szeg (MAC) helyett csak a nyílt üzenet hash függvényes lenyomatát használjuk 
ellenőrző összegként. A kriptográfiai hash függvény lényegében egy olyan egy- 
irányú leképezés, amelynél nehéz feladat azonos lenyomatra (hashképre) vezető 
ősképeket találni. Azaz ha X jelöli a nyílt üzenetet, 


X, Hash(X) 


kerül átküldésre A-tól B-hez, ahol Hash egy nyilvánosságra hozott függvény. Ért- 
hetetlennek tűnik az állítás, hiszen bárki előállíthat X", Hash(X") párt tetszőleges, 
általa választott X" üzenethez. Mégis használható lehet a módszer a gyakorlatban, 
ha ezen algoritmikus eszközökön túl, A és B között telefonösszeköttetés is rendel- 
kezésre áll. Ekkor ugyanis B felhívja A-t, akinek hangját ismeri, azt kéri, hogy az 
elküldött hash érték elegendő számú — hexadecimális — karakterét olvassa be a 
telefonba. 


Digitális aláírás 


Míg az üzenet- és partnerhitelesítés protokollok a kommunikáció időtartamára 
és a partnerek számára nyújtanak hitelesítési lehetőséget, addig a digitális aláírás 
az üzenetváltás után és harmadik személy számára is nyújt hitelességellenőrzési 
lehetőséget. A digitális aláírás protokollok a következő feladatot oldják meg: 


a) az aláírás generálása (az üzenetet küldő végzi) 
b) az aláírás ellenőrzése (az üzenetvevő által) 


c) hitelességgel kapcsolatos vitás kérdések harmadik személy (pl. bíróság) 
előtti tisztázása. 


A c) pontban említett vita tárgya lehet: az aláíró szeretne letagadni egy koráb- 
ban általa küldött üzenetet, mert tartalma már kedvezőtlen számára. Vád tárgya 
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lehet az is, hogy a címzett saját céljainak megfelelően módosította a küldött üze- 
netet. 

A digitális aláírás utánozni kívánja a valódi kézjegy tulajdonságait, nevezete- 
sen: 


a) legyen könnyen generálható, 


b) ne legyen egyik , okmányról" a másikra áthelyezhető (hamisítható), azaz 
csak a tulajdonosa generálhassa, 


c) , bárki" képes legyen ellenőrizni annak hitelességét. 


A digitális aláírásnak a fenti közös tulajdonságok mellett van egy igen fontos 
sajátossága, mégpedig az, hogy nem az üzenet anyagi hordozójához (pl. papír) 
tartozik, hanem tartalmilag kapcsolódik az aktuális üzenethez, azaz üzenetfüggő. 

Nyilvános kulcsú titkosító algoritmus felhasználásával egyszerűen készíthe- 
tünk digitális aláírást. Tegyük fel, hogy A az x üzenetet kívánja B-nek elküldeni 
olyan módon, hogy egyúttal aláírását is elhelyezze a rejtett üzenetben. Ezt elér- 
heti, ha a titkos kulcsát alkalmazva egy dekódolási lépést hajt végre (tegyük fel 
egyelőre, hogy az x üzenet hossza nem nagyobb, mint a dekódoló transzformáció 
input mérete). Nyilván 

Da(x) 


függvénye mind az x üzenetnek, mind pedig a titkos dekódoló kulcsnak, tehát csak 
A képes előállítani azt. Az üzenetvevő B fél ismerve A nyilvános kulcsát képes x 
visszaállítására egy 


x — EA(Da(x)) 


kódolási lépéssel. Abban az esetben, ha x egy B által is ismert formátummal (álta- 
lánosabban redundanciával) rendelkező üzenet, akkor DA(x) önmagában az aláírt 
üzenet, s nem csak az aláírás. Ugyanis csak A képes olyan z, dekódoló output mé- 
retű blokkot előállítani, amelyre Ex (z) nem egy véletlenül választott blokk lesz, 
hanem olyan, amely megfelelő formátummal is rendelkezik. Ha azonban nem té- 
telezhetjük fel, hogy B formátum ellenőrzést végez (pl. a B oldali szoftver erre 
nem készült fel), akkor egyszerűbb, ha a DA(x)-et csak aláírásnak tekintjük, amit 


az x üzenethez csatolva küldünk el, azaz ekkor 
[x, DA(x)] 


az aláírással hitelesített üzenet. B fél ekkor az E4(DA(x) ) kódolási lépés eredmé- 
nyét veti össze a nyíltan is megérkezett x üzenettel. 
Ezzel teljesítjük a következő — aláírással szembeni — elvárásokat: 
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a) az aláírás hitelessége biztonsággal ellenőrizhető: B az A nyilvános kulcsát 
használó kódolási lépéssel bizonyossággal megállapíthatja, hogy a küldő A 
volt-e 


b) az aláírás nem hamisítható: csak A ismeri a szükséges titkos kulcsot 


c) az aláírás nem vihető át egy másik dokumentumra: az aláírás függvénye az 
adott dokumentumnak 


d) az aláírt dokumentum már nem változtatható meg: ha megváltoztatják a 
dokumentumot, ahhoz nem illeszkedik már az aláírás 


e) az aláírás letagadhatatlan: B-nek nincs szüksége A-ra, hogy egy harmadik 
fél számára bebizonyítsa, miszerint A küldte az aláírt dokumentumot. 


Mindezen elvi tökéletességek ellenére két ponton tovább érdemes finomítani 
az aláírás protokollt. Ezek a pontok a 


e lenyomatkészítés, 
e időpecsét alkalmazása. 


Célszerű a dokumentum méretétől függetleníteni az aláírás méretét, s egy al- 
kalmas nyilvános egyirányú dimenziószűkítő függvény (hash függvény) felhasz- 
nálásával nem az eredeti dokumentumra, hanem annak lenyomatára adni az aláí- 
rást. Ekkor az aláírt üzenet 

[x, DA(Hash(x))] 


alakú. Egy támadó x megfigyelésével a hash függvény nyilvánossága miatt ki 
tudja számolni Hash(x) értékét. Sikeres támadáshoz azonban arra van szüksége, 
hogy egy olyan x/ üzenetet találjon, amivel csaló célját elérheti, s ugyanakkor 
Hash(x) — Hash(x ), mert ezesetben [x , DA (Hash(x) )] is hiteles üzenet B szemé- 
ben. Csakhogy egy elfogadható hash függvény garantálja, hogy gyakorlatilag nem 
találhatunk azonos hash értékre vezető x" üzenetet. A támadó feladatát még csak 
tovább nehezíti, hogy egy ilyen azonos hash értékre vezető üzenetnek ráadásul 
értelmes, sőt céljainak megfelelő csaló tartalmúnak kell lennie. 


Időpecsét az aláírásban és a letagadásvédelem 

Tegyük fel, hogy A aláírásával hitelesítetten elküldött B-nek egy szerződést, majd 
egy idő múlva — a körülmények számára kedvezőtlenné válása miatt — szeretné, 
ha letagadhatná az aláírt szerződés elküldését. Elhíreszteli, hogy már előzőleg 
kompromittálódott a titkos kulcsa, ezért nem vállal felelősséget a nevében aláírt 
szerződésétrt. 
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Ahhoz, hogy A ne tudja letagadni, hogy ő írta alá a dokumentumot, nyilván 
nem elég az időpont, de egy harmadik megbízható személy részvételével a prob- 
léma megoldható. Legyen ez a személy G. Egyszerűbb jelölés kedvéért az aláb- 
biakban S4(x) jelölje az A által digitálisan aláírt x dokumentumot, továbbá VA (X ) 
jelölje az A általi aláírással elátott X — S4(x) dokumentum ellenőrzését az aláírás 
hitelessége szempontjából. Tekintsük a következő protokollt: 


1. AGG: U —SA(I,S4(x)) 

. G: VA(U) 

3. GO A: W—SG(T,I,S4(x)) 
Gő B: W—SdG(T,I,S4(x)) 

4. A: VG(W) 

5. B: VG(W),I,VA(SA(x)) 


(5.38) 


Az 1. lépésben A aláírja az x dokumentumot, az aláírt dokumentumot (SA (x)) 
kiegészíti azonosító fejléccel (7), s újra aláírja az eredményt, amellyel U-t kapja. 
Az azonosító információ minimálisan azt tartalmazza, hogy A B-számára szándé- 
kozik aláírt dokumentumot küldeni. A 2. lépésben G ellenőrzi az U által hordozott 
külső aláírást, valamint az azonosító / információt. G az aláírt x dokumentumot 
és az I azonosító információt kiegészíti egy időpecséttel (7), majd az eredményt 
aláírja, s a 3. lépésben elküldi azt mind A-nak mind pedig B-nek. A 4. lépésben 
A ellenőrzi a G-től érkezett üzenetet, s ha nem ő küldte előzőleg az / azonosítójú, 
SA(x) aláírt dokumentumot, akkor azonnal jelzi, hogy kompromittálódott titkos 
kulcsával visszaéltek. Az 5. lépésben B ellenőrzi G aláírását, az / azonosító infor- 
mációt, majd pedig A aláírását. 

Az I azonosító használata némi magyarázatra szorul. Ugyanis úgy gondol- 
hatnánk, hogy a dokumentum (Xx) elvárhatóan tartalmazza a két fél azonosítóját. 
Azonban nem feltétlen köthetjük meg, hogy a dokumentumában ki hova tegyen 
azonosítót, s egy számítógépes, automatikus alírásellenőrző rögzített pozíciójú 
adatmezőkkel nyilván egyszerűbben dolgozik. Továbbá az 5. lépésben B az / in- 
formációból tudja meg, hogy A küld számára aláírt dokumentumot, s A nyilvános 
kulcsával kell a VA(S4(x)) verifikációs lépést végrehajtania. 


Másolható-e a digitális aláírás? 

Tekintsünk egy RSA-kódolást használó titkosítást. Egy x nyílt üzenethez csak az 
A felhasználó tudja előállítani a DA(x) transzformáltat. Tegyük fel, hogy a sok- 
felhasználós rendszerünkben egy , közjegyzőt" alkalmazunk, amely a saját titkos 
kö j kulcsának felhasználásával egy hozzá benyújtott r nyílt üzenethez a Dxj(r) 
aláírást generálja. Egy támadó egy t üzenetére szeretne aláírást kapni, amelynek 


azonban a tartalma olyan, amit nyíltan, a felfedődés veszélye nélkül nem mutat- 
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hat be a közjegyzőnek. Kérdés, hogy van-e mód arra, hogy mégis generáltasson 
aláírást a közjegyzővel a t üzenetére. Járjon el a támadó a következőképpen: 


1. Tetszőlegesen választott x üzenethez az Exj nyilvános transzformáció is- 
meretében meghatározza az 


y— Ex) 
rejtett üzenetet. 


2. Az aláírandó t üzenetet módosítja a tartalmában már nem veszélyes f/-re: 


r —-—y:t (mod mxgj) 


3. A ft" üzenetre kér aláírást, azaz a közjegyzővel előállíttatja az 
s — Dkj(t) 
aláírást. 
4. Az s" aláírás a következő alakba írható: 
s — (17 — (y-r)9 —y1 11 —x-ti (mod imgj) 


ahonnan 
(mod mxj) 


24 


szorzással előállíthatja a kívánt aláírást. (Mivel x-et a támadó választja, 
ezért invertálhatóra választhatja.) 


A támadó tehát tetszőleges üzenetre képes generálni aláírást anélkül, hogy ar- 
ról tudna az aláíró. Ez a támadási mód azonban mégis csak elvileg lehetséges. Egy 
aláírandó üzenetről (dokumentumról) megkövetelhetjük, hogy formátum-megkö- 
téseknek tegyen eleget, azaz tartalmazzon speciális információkat kötött pozíci- 
ókban, így pl. felhasználó- és dokumentumazonosítót, dátumot, ahogyan az egy 
szokásos dokumentumnál is szükséges. Ezt a formátumot ellenőrizze a közjegyző 
(közjegyző program) is aláírás előtt. Ha ezen formátum-megkötéssel és ellenőr- 
zéssel kiegészítjük az egyszerű aláírásprotokollunkat, akkor a fentebb elmondott 
támadási módszer már nem vezethet sikerre. Ugyanis a t üzenetet nem tudjuk 
modulo szorzással egy formátumnak megfelelő t" üzenetbe átvinni (2. lépés). A 
protokoll tehát olyan megszorítással működteti a dekódoló transzformációt, hogy 
az értelmezési tartományának csak egy részhalmazából vehetünk elemeket. (Meg- 
jegyezzük, hogy ezen támadás algoritmikus ötlete rokon az (5.32) protokoll elleni 
támadáséval.) 
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Titok megosztása 


Mint láttuk, a titkosító transzformációk mindegyike esetén szükséges valami- 
lyen titkos információ, a titkos kulcs, amelyet már nem véd újabb titkosító transz- 
formáció. Ehhez ugyanis újra valamilyen titkos információ kellene s.í.t.. Így ezt a 
titkos információt másfajta védelemre kell bízni. Leheteséges pl. valamilyen fizi- 
kai védelem alá helyezés (memorizálás, felnyitás-biztos dobozba helyezés, stb.). 
Egy másik módszer úgy igyekszik , feldarabolni" a titkos információt N személy 
között, hogy abból tetszőlegesen választott K személy együttesen rekonstruálni 
tudja a titkot, de K-nál kevesebb személy sohasem legyen erre képes, ahol K c N. 
Ez a megoldás nyilván rekonstruálhatóvá tenné a titkot még akkor is, ha annak 
legfeljebb N — K darabja megsemmisülne. 

Kézenfekvő lenne a binárisan ábrázolt titok valahány, mondjuk 7 szeletének 
szétosztása. Ez azonban nem helyes megoldás. Ha ugyanis a szeletek számával 
egyező a személyek száma (N — T), akkor egy rész megsemmisülése is a titok 
elvesztéséhez vezethet, másrészt az összes személy szükséges a rekonstrukció- 
hoz. Ha viszont több személynek is adjuk ugyanazt a szeletet (N 5 7), akkor 
nem választhatunk tetszőleges K — T személyt a rekonstrukcióhoz. Továbbá, je- 
lentős információval rendelkezik 7-hez közeli számú személy együttese, hiszen 
közvetlenül a titkos bináris információ részeit kapták meg. 

Egy kicsit javíthatunk a helyzeten a következőképpen. Címezzük meg a lehet- 
séges titkok S halmazának elemeit a O, Il , . . . 7 — 1 számokkal. Válasszunk N — 1 
alkalommal véletlenszerűen egy-egy elemet a (0, 1, 2, . . . , g— 1) halmazból, elő- 
állítva r1,r2, ...,rn-1 teljesen független, egyenletes eloszlású valószínűségi vál- 
tozót. Jelölje s € § az aktuális titkot, s az NM személynek szétosztandó N számú 
információ legyen ri, r2 , . . . Tv-—1, Tu, ahol 


rv-s-(ri1tr2Tt...krw-1) mod a. 


Ekkor ugyan továbbra is az összes személy szükséges a titok rekonstruálásához, 
viszont N-nél kevesebb részlet ismerete nem nyújt információt a titokra vonatko- 
zóan. Vegyük azt is észre, hogy ekkor a titok-darabok mindegyikének azonos a 
mérete a titokéval. 

Ha ezen véletlenítési ötletet ötvözzük a Reed-Solomon-kódolással, akkor egy 
kívánt megoldáshoz jutunk. Nevezetesen tekintsünk egy (N,K) paraméterű RS- 
kódot GEH(g) felett, ahol g legyen prímhatvány (ha g eredetileg nem ilyen lenne, 
bővítsük ki fiktív elemekkel az S halmazt). Az RS-kódok ismert tulajdonsága sze- 
rint a kódszó legalább K elemének ismeretében egyértelműen dekódolható, amit a 
hibajavító kódolás elméletében úgy fogalmazunk, hogy CN — K törlés javítására 
alkalmasak. Ezt a tulajdonságot a titok-szétosztásban a következőképpen kama- 
toztathatjuk: 
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Válasszunk K — 1 elemet véletlenszerűen GF(g)-ból, ezeket jelölje ri, ra, . . . , 
rgk-1, továbbá legyen ro — s. Az 


r — (rToT1,... TK-1) 


vektort tekintsük az RS-kóddal kódolandó üzenetnek, azaz eztegy G, GF(g) feletti 
K x N dimenziós generátormátrixszal leképezzük egy 


c — (Co, CL). .5CN—1) 


kódszóba a 
c—rG 


lineáris transzformációval. A c kódszó elemeit osszuk szét az N személy között. 
A G generátormátrixot választhatjuk a következőképpen: 


1 1 1 
a o2 aN-1 
G — 
1 aKk-1 g2(K-D ... a(N—1(K-D) 


ahol a c GF(g) N-edrendű primitív elem. Bevezetve a 
D(x) —rot-rix4 ek reeax 1 
GFE(g) feletti polinomot, a c kódszó elemei a 


cs—D(a/), — i—0,1,...,M—1 


alakban is előállíthatók. Ennek a konstrukciónak van egy érdekes interpretációja: 

Egyetlen olyan X — 1 fokszámú y — D(x) polinom létezik (lehet valós számtest 
vagy véges test feletti), amely adott (y1,x1), (y2, x2), . . . ; (VK, xx) K számú ponton 
keresztül fektethető, vagyis amelyre 


yi — DG), 1£igK. 
Ha tehát N darab, egy (K — 1) fokszámú görbén fekvő pontot választunk, akkor 


bármely legalább K pontot tartalmazó részhalmazból a görbe (polinom) rekonst- 
ruálható, amelynek a nulladfokú tagja a titok. 
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5.6. Feladatok 


5.1. feladat. Egy egyszerű lineáris rejtjelezőt konstruálunk: y — ax--b modr 
lineáris transzformációval rejtjelezünk, ahol 0 € a,b C s, a és b a kulcs részei, x 
a nyílt szöveg, y a rejtett szöveg, továbbá r az ábécé mérete. 


a) Adja meg a kulcstér méretét, ha s — 26! 


b) Támadóként a kulcsot szeretnénk megfejteni. Nagyon egyszerű strukturájú 
a rejtjelező. A forrás jól tömörített, véletlen forrásként modellezhető. Rej- 
tett szövegű támadásban is gondolkodhatunk? 


c) Milyen információt kellene birtokolnunk ilyen forrás esetén a sikeres táma- 
dáshoz? 


d) Mit mondhatunk azon esetben, ha a forrás írott szöveg, s imerjük a karak- 
tergyakoriságot? 


5.2. feladat. Az y — ax1-b mod N betűnkérnti lineáris rejtjelezés transzformációt 
tekintjük, ahol N az ábécé mérete. 


a) Hány ilyen transzformáció van, ha N — 30? 


b) x a transzformáció fixpontja, ha y — x teljesül. Legyen a -— 1. Mutassuk 
meg, hogy ha N prímszám, akkor pontosan egy ilyen fixpont van! 


c) Adjunk meg olyan N értéket, amelyre nincs fixpontja a transzformációnak! 


5.3. feladat. Tegyük fel, hogy y — Ax--b lineáris transzformációval rejtjelezünk, 
ahol A n x n-es bináris mátrix, x,y, b n hosszú bináris vektorok, továbbá A és b a 
kulcs részei, x a nyílt szöveg, y a rejtett szöveg. Az algoritmikus támadó célja a 
kulcselemek meghatározása. 


a) Végrehajtható-e a támadás, ha a támadó 


e y1,y2,... rejtett szövegeket 


e (x1,y1), (x2,y2), . . . nyílt-rejtett szöveg párokat 


tud megszerezni? Adja meg a támadás módját, ha ilyen van, valamint a 
sikeres támadáshoz szükséges információ mennyiségét! 


b) Korlátozhatjuk-e a támadás sikerét azzal, hogy maximáljuk egy kulcs fel- 
használásának számát (egy kulcsot szeretnénk minél többször használni)? 
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5.4. feladat. Tekintsük egy szimmetrikus rejtjelező páros gráf reprezentációját, 
azaz amelyben egy x nyílt üzenetet egy y rejtjeles üzenettel él köt össze, ha vala- 
mely k kulcsra Ex(x) — y. Igazolja, hogy a tökéletes rejtjelezés páros gráfjában a 
csomópontpárokat azonos számú él köti össze. 


5.5. feladat. One-time-pad rejtjelezést tekintünk: 


a) Pénzfeldobás-sorozattal generálunk bináris véletlen folyamot, ahol a pénz 
egyik felére gyakrabban esik, s a 0 kimenetel valószínűsége p - 0.5. Hasz- 
nálhatjuk-e ezt kulcsfolyamként egy one-time-pad rejtjelezőben? 


b) A rejtjelezést hogyan befolyásolja a kódolandó nyílt szöveg redundanciájá- 
nak mértéke. (Pl. erősen strukturált szövegeket , nehezebb-e rejteni" ezen a 
módon?) Formálisan indokoljon! 


5.6. feladat. Valaki azt állítja, hogy egy RSA-algoritmus biztonságát nem veszé- 
lyezteti, ha az e nyilvános kulcs és m — pi : pa modulus mellett a d(m) értékét is 
nyilvánosságra hozzuk. Igaz ez? 


5.7. feladat. Egy játék RSA-algoritmus esetén pi — 23, pa — 11 prímeket válasz- 
tottuk. Adja meg a lehető legkisebb kódoló kulcsot, s az ehhez tartozó dekódoló 
kulcsot, majd kódolja az x — 5 üzenetet! 


5.8. feladat. Tegyük fel, hogy DES (Data Encryption Standard) rejtjelezést hasz- 
náltunk 64 bites üzenet blokkok rejtjelezésére, amelyek 8 bites karakterekből áll- 
nak, s a 8. bit páros paritás. Elvben végrehajtható-e kulcskereséses támadás csak 
rejtett szövegek megfigyelésére alapozva? Hány rejtjeles blokkot kellene megfi- 
gyelni ehhez? (A DES 64 bites nyílt szövegblokkot azonos méretű rejtett szö- 
vegblokkba kódol, amelyhez 56 kulcsbitet használ.) 


5.9. feladat. Tekintsünk egy RSA-rejtjelzőt e — 3 nyilvános kulccsal. Legyen 
a blokkhossz 128 bájt. Tegyük fel, hogy rövidek az üzeneteink, hosszuk nem 
nagyobb mint 40 bájt, s a nagyobb helyiértékek felé nullákkal egész blokkokra 
egészítjük ki azokat. Valaki azt állítja, hogy a rejtett blokkokat lehallgatva fejti az 
üzeneteket. Milyen tanulságot vonna le? 


5.10. feladat. Ha két, RSA-rejtjelezéssel kommunikáló pár között az üzenetek 
tere, azaz a különböző lehetséges üzenetek száma kicsi halmaz, az támadásra ad 
lehetőséget. Tegyük fel, hogy a támadó, ismerve a kommunikáló partnerek közti 
szokásos információcserék halmazát, de nem ismerve az RSA dekódoló kulcsot, 
támadásra szánja el magát. Adja meg a támadás menetét, s javasoljon — algorit- 
mikus — védekezési módot! 
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5.11. feladat. RSA-algoritmus számára történő prímválasztásnál egyik követel- 
mény, hogy a két prím bitmérete legyen lehetőleg közel azonos. Például 1024 
bites modulus esetén 512 bites prímeket választunk. Ugyanakkor, ha a p — g dif- 
ferencia nem elegendően nagy, akkor faktorizálhatóvá válhat a modulus. Adjon 
egy faktorizálási algoritmus! 

(Segítség: Tekintsük a következő felbontást: m — pg — (t-s5)(t— s) — 1? — 5? 
alakból, ahol p — t 4-s,g — t — s, látható, hogy s — (p— 9) /2 viszonylag kicsi 
volta miatt t Az V/m.) 


5.12. feladat. Arra, hogy az RSA-algoritmus fejtésének nehézsége a modulus 
faktorizálásával ekvivalens feladat, csak erős sejtés létezik. Ugyanakkor, ha rögzí- 
tett, (pl. e — 2) kódoló kitevőt használunk, akkor már ugyanez a sejtés igazolható. 
Igazoljuk tehát, hogy ekkor a megfigyelt rejtett szöveg alapján a nyílt pár megfej- 
tésének bonyolultsága a modulus faktorizációjával ekivivalens feladat. 

(Segítség: Tekintsük az xx —c mod m, 0 a c c m, m — pg egyenletet, ahol p és 
g prímszámok. Ha van megoldása az egyenletnek, akkor négy megoldása van, s 
a megoldások (b1,m — b1,ba,m— b2 ), 0 c bi1,b2 — n. p és g ismeretében a négy 
megoldást az x. —c mod p,x" — c mod g egyenletpár megoldásait felhasználva 
a kínai maradéktétel segítségével kaphatjuk meg. Ha viszont ezen faktorok nem 
ismertek, az egyenlet megoldása nehéz.) 


5.13. feladat. Szeretnénk megtudni A felhasználó m — pg RSA-modulusa titkos 
faktorjait. Felelőtlenül jár-e el A, ha , baráti" kérésünkre egy b számnak meg- 
mondjaegy mod mm szerinti négyzetgyökét. 


5.14. feladat. Kriptoanalistaként támadjon egy RSA-rejtjelezőt, amelyről a nyil- 
vános m — 4003997 modulus, valamint az e — 379 kulcs mellett megtudja a b(m) — 
3999996 értéket is. 


a) Számítsa ki a d dekódoló kulcsot! 


b) Adja meg az m — p1p2 prímfaktorait! 


5.15. feladat. Az RSA-algoritmus az m — (p— 1)(g— 1) modulust alkalmazza a 
kulcsgenerálásnál. Használhatnánk-e az m" — Ikkt(p — 1,g— 1) modulust e he- 
lyett? 


5.16. feladat. Jelszavas védelem során a salting azt jelenti, hogy r számú véletlen 
bittel meghosszabbítják a jelszavakat a jelszóverifikáció során, s aztán alkalmaz- 
zák az egyirányú leképezést, majd a leképezés eredményének a tárolt jelszótábla 


elemmel történő egybevetését. A salt bitfüzér nyíltan kerül tárolásra a jelszótáb- 
lában, s a különböző felhasználók saját salt bitekkel rendelkeznek. Felmerül a 
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kérdés, hogy mi a salt bitek jelentősége, ha azok nyíltan tárolódnak, azaz a jelszó- 
tábla , szótáras" támadója is olvashatja azokat? 


5.17. feladat. Tegyük fel, hogy véletlenszerűen választunk a jelszótér elemei kö- 
zül jelszavakat. Legyen m a jelszó hossza, c a karakterábécé mérete, t a verifi- 
kációs leképezés iterációinak száma, továbbá r jelölje egy iteráció futási idejét. 
Legfeljebb 7 hosszú jelszót szereténk használni. A karakterábécé vonatkozásában 
három lehetőségben gondolkodunk: 


e c — 26 méretű kisbetűs 
e c — 36 méretű kisbetűs, alfanumerikus 
e c — 62 méretű kis- és nagybetűs, alfanumerikus. 


Legyen t — 25 az iterációk száma, továbbá r — 4 mikrosec. Adja meg azon vá- 
lasztási lehetőségeket, amely mellett a jelszótér kimerítő végigkeresésén alapuló 
támadás számítási ideje legalább 100 nap. 

Ha a hosszmegkötést nem kellene figyelembe venni, s a jelszavakat a szótár két 
tetszőleges szavának egymás mellé illesztésével képeznénk, egy 250000 tételes 
szótárméret elegendő lenne-e? 


5.18. feladat. A háromlépéses, előzetes kulcscserét nem igénylő rejtett üzenetto- 
vábbító kriptográfiai protokollban a kulcsbitek üzenetbitenkénti mod 2 hozzáa- 
dásával rejtjeleznek a felek. Helyesen cselekszenek-e? 


5.19. feladat. Tegyük fel, hogy egy űrjármű (A) leszálláshoz készülődik egy tá- 


PONT d 


voli bolygó űrállomásán (B), s ehhez először azonosítania kell magát. A feltételek: 
e B ismeri A jelszavát, ezen kívül más közös titkuk nincs. 
e A mod 2 összeadásnál bonyolultabb műveletet nem tud végezni. 


e A lesugárzott jeleket egy az űrállomás környéki támadó (C) is lehallgat- 
hatja, mivel nem lehet jól koncentrálni a sugárzást. Ugyanakkor a bolygón 


levő űrállomás képes úgy továbbítani a jeleket, hogy azok a bolygó felszí- 
nén nem vehetők. Javasoljon egy protokollt a biztonságos azonosításra! 


5.20. feladat. A klaviatúra 26 kisbetűs karakteréből, a 10 számkarakterből, va- 
lamint az üreshely (space) karakterből álló 37 betűs ábécéből képezünk titkos, 7 
karakterből álló jelszót. 3 személy között kívánjuk szétosztani a titkot úgy, hogy 
legalább 2 személy jelenléte esetén lehessen csak azt rekonstruálni. Legyen a titok 
4gt7óff. Adjon meg egy megosztási és rekonstrukciós algoritmust, s ossza szét az 
adott titkot! 
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5.21. feladat. A véletlen csatornahibák detekciójára szolgáló CRC-kódok nem 
alkalmasak szándékos bitmanipulációk detektálására. Mutassa ezt meg a követ- 
kező konkrét példán. Legyen , pay to john 1000$" a továbbítandó nyílt szöveg 
(ASCII kódot használjon, s vegye figyelembe a szóközöket is). Manipulálja a 
nevet , jack"-re. A következő szabványos CRC-polinomot használja az , integri- 
tásvédelem": p(x) —1--x2 xx! 


5.22. feladat. Tekintsen egy additív kulcsfolyamos rejtjelezést. Vizsgálja meg, 
hogy ezen rejtjelezés biztosít-e adatintegritás-védelmet! 


5.23. feladat. Egy cég informatikai központja szoftverek egy-egy példányát szét- 
osztja a kihelyezett egységei informatikai részlegeinek. Szeretné a szoftverek sér- 
tetlenségét biztosítani, s alkalmanként (például hetente) szeretné ellenőrizni azok 
helyességét. A feladat megoldásához azonban nem kíván titkos kulcshoz kapcso- 
lódó eljárásokat alkalmazni, például azért mert a korrekt kulcsgondozás kényes és 
költséges feladat, s erre nem kíván felvonulni, erőforrásokat lekötni. Lehetséges-e 
megoldás ilyen feltételek mellett? 


5.24. feladat. Az egyik legfontosabb MAC hash függvény generálás blokk rejt- 
jelező kódok CBC módját használja. Az m — [M1,M2 , . . . , Mr] üzenetre k kulcs 
mellett adott MAC legyen az alábbi: 


MACk(m) — Ex(Ex(-"" Ex(M1) 6M2) DM. 1) DB: M)), 


ahol az E, : (0,11"— (0,1)" egy titkos kulcsú rejtjelező transzformáció. 
Mutassa meg, hogy a fenti definíció szerinti MAC hashing nem teljesíti az egyi- 
rányúság követelményét egy k kulcsot ismerő fél számára! 

(Segítség: Mutassa meg, hogy n-bites üzenetblokkok tetszőleges véges sorozatát 
— a k kulcs ismeretében — kiegészíthetjük úgy egy további blokkal, hogy előre 
megadott MAC álljon elő!) 


5.25. feladat. Egy MAC választott szövegű támadás ellen védett, ha egy támadó 
rendelkezésére áll MAC,(m;) az általa választott mi , ma , . . . , m j üzenetekre, még- 
sem képes ennek alapján kiszámítani egy MAC,(m) lenyomatot egy új m - mi 
üzenetre. Az 5.24. feladatbeli definíció szerinti MAC-t tekintsük. Mutassa meg, 
hogy az MAC nem védett választott szövegű támadás ellen! 

(Segítség: Mutassa meg, hogy két n bites — azaz 1 blokk méretű — üzenetből 
konstruálható megfelelő 2n bites üzenet!) 

Mutassa meg továbbá, hogy az MAC nem védett választott szövegű támadás ellen 


akkor sem, ha úgy kívánjuk megerősíteni, hogy az MAC számítás előtt kiegé- 
szítjük az üzenetet egy olyan blokkal, amely az üzenet hosszát tartalmazza! A 
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támadó képességéről azt teszzük fel, hogy üzeneteire MAC lenyomatot kaphat, 
de a k kulcsot nem ismeri. 


5.26. feladat. Tekintsük az alábbi integritásvédelmi kódolást, ahol a rejtjelezés 
és MAC kombinációját használjuk: 


Ex(mIJMACy (m)). 
Továbbá E;(x) CBC módú rejtjelezés, al]b az a és b bináris vektorok egybefűzése. 
A rejtjelezés, illetve az MAC számítás tekintetében, az egyik funkcióra [/V, k] 
míg a másikra [/V".k"] linicializáló vektor, kulcs] pár kerül alkalmazásra. Van- 
e veszélye annak, ha IV — IV" k — k! , egyszerűsítő" választással élünk? Mi a 
tanulság? 


5.27. feladat. Egy véletlen bitfolyam generátor kimenetén ugyan megmaradt az 
egymás utáni bitek statisztikai függetlensége, de 5-nél nagyobb, p — 0.75 valószí- 
nűséggel kapunk 0-t a kimeneten. Milyen mértékben korrigálhatjuk a bitfolyam 
statisztikát azzal, hogy 8 bites szeletekre bontjuk a folyamot és az egyes szeletek 
8 bitjéből modulo 2 összeadással egy-egy bitet generálunk? 


5.28. feladat. Külföldön dolgozunk, s szeretnénk rejtetten párbeszédet folytatni 
az otthoni barátunkkal (például számítógépes modemkapcsolat útján), azonban 
tilos rejtjelezni a határon átlépő üzeneteket. Hitelesítő protokollok használata 
ugyanakkor nem tiltott (amikor is a nyílt szöveg nyílt marad). 


a) Van megoldás? 


b) Ha megtalálta, adjon egy példát egy rövid párbeszéd védelmére! 


5.29. feladat. Szimmetrikus kulcsú rejtjelező transzformáción alapuló egyirányú 
transzformáció, amelyet PIN kódolására használnak, tipikusan a következő álta- 
lános alakú: 


AP — f(KP,PIN, ID) 


AP: nyilvános hitelesítő paraméter (authentication parameter), 
KP: titkos kulcs paraméter (key parameter), 
PIN: titkos személy-azonosítószám (personal identification number), 
ID: nyilvános azonosító (identification data), 
f egy egyirányú függvény. A legismertebb ilyen függvény az E,(:-) DES transz- 
formáción alapul: 
AP — ExpepPIN(ID) 
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A verifikációs táblázat tartalma a következő: 
ID1 AP 
ID2 AP: 
ID) AP, 


A táblázat olvasható, mivel f egyirányú leképezés, és AP ismerete egy adott ID- 
hez nem segít a PIN kiszámításában. 
Mutassuk meg, hogy ugyanakkor a következő leképezés 


AP — ExkpPoepPIN (ID E PIN) 


nem egyirányú abban az értelemben, hogy nem , nehéz feladat" megadni olyan 
KP" PIN" párt amelyre 


f(KP",PIN" ID) — f(KP,PIN, ID). 
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